この手の累積和高速化が半端じゃなく苦手なことがわかった。
問題概要
長さ の数列 が与えられる。
この数列をいくつかの区間に分割する方法のうち、 番目の区間に含まれる数列の要素の総和が で割り切れるようなものの個数を 1000000007 で割った余りを求めよ。
制約
考えたこと
は通るが、 は通らない。しかし、愚直にやると の計算量の DP 解法となる。次の配列 dp
を考えたくなるだろう。
dp[i][j]
← 数列の先頭から 個の要素を 個の区間に分割する方法のうち、条件を満たすものの個数
この DP は次のように更新できる。なお、数列 の累積和を とする。
のうち、 であるような について、
dp[i][j] += dp[k][j-1]
このままだと の計算量となるので、累積和を用いて高速化しよう。
累積和
次の配列を考える。
sum[i][j][r]
← のうち、 であるような についての、dp[k][j-1]
の総和
この sum
は次のように更新できる。
、 について
- のとき:
sum[i+1][j][k] = sum[i][j][k] + dp[i][j-1]
- そうでないとき:
sum[i+1][j][k] = sum[i][j][k]
また、この sum
を用いると、DP 更新式は次のように書き直せる。
dp[i][j] = sum[i][j][S[i]%j]
配列 sum
の in-place 化
さて、一見すると sum
の更新には の計算量 (時間的にもメモリ的にも) を要するようにも思える。しかし、配列 sum
の更新は in-place 化できることに注意しよう。つまり、毎回次のような更新をすればよいことになる。これで sum
の更新も の計算量で実現できる。
について、
sum[j][S[i]%j] += dp[i][j-1]
これによって、全体の計算量も となる。
コード
#include <bits/stdc++.h> using namespace std; // modint template<int MOD> struct Fp { // inner value long long val; // constructor constexpr Fp() : val(0) { } constexpr Fp(long long v) : val(v % MOD) { if (val < 0) val += MOD; } constexpr long long get() const { return val; } constexpr int get_mod() const { return MOD; } // arithmetic operators constexpr Fp operator + () const { return Fp(*this); } constexpr Fp operator - () const { return Fp(0) - Fp(*this); } constexpr Fp operator + (const Fp &r) const { return Fp(*this) += r; } constexpr Fp operator - (const Fp &r) const { return Fp(*this) -= r; } constexpr Fp operator * (const Fp &r) const { return Fp(*this) *= r; } constexpr Fp operator / (const Fp &r) const { return Fp(*this) /= r; } constexpr Fp& operator += (const Fp &r) { val += r.val; if (val >= MOD) val -= MOD; return *this; } constexpr Fp& operator -= (const Fp &r) { val -= r.val; if (val < 0) val += MOD; return *this; } constexpr Fp& operator *= (const Fp &r) { val = val * r.val % MOD; return *this; } constexpr Fp& operator /= (const Fp &r) { long long a = r.val, b = MOD, u = 1, v = 0; while (b) { long long t = a / b; a -= t * b, swap(a, b); u -= t * v, swap(u, v); } val = val * u % MOD; if (val < 0) val += MOD; return *this; } constexpr Fp pow(long long n) const { Fp res(1), mul(*this); while (n > 0) { if (n & 1) res *= mul; mul *= mul; n >>= 1; } return res; } constexpr Fp inv() const { Fp res(1), div(*this); return res / div; } // other operators constexpr bool operator == (const Fp &r) const { return this->val == r.val; } constexpr bool operator != (const Fp &r) const { return this->val != r.val; } constexpr Fp& operator ++ () { ++val; if (val >= MOD) val -= MOD; return *this; } constexpr Fp& operator -- () { if (val == 0) val += MOD; --val; return *this; } constexpr Fp operator ++ (int) const { Fp res = *this; ++*this; return res; } constexpr Fp operator -- (int) const { Fp res = *this; --*this; return res; } friend constexpr istream& operator >> (istream &is, Fp<MOD> &x) { is >> x.val; x.val %= MOD; if (x.val < 0) x.val += MOD; return is; } friend constexpr ostream& operator << (ostream &os, const Fp<MOD> &x) { return os << x.val; } friend constexpr Fp<MOD> pow(const Fp<MOD> &r, long long n) { return r.pow(n); } friend constexpr Fp<MOD> inv(const Fp<MOD> &r) { return r.inv(); } }; int main() { const int MOD = 1000000007; using mint = Fp<MOD>; int N; cin >> N; vector<long long> A(N), S(N+1, 0); for (int i = 0; i < N; ++i) { cin >> A[i]; S[i+1] = S[i] + A[i]; } // dp[数列 A のうち左から i 個分][j 個のブロック] = 分割の個数 vector dp(N+1, vector(N+1, mint(0))); vector sum(N+1, vector(N+1, mint(0))); dp[0][0] = 1, sum[1][0] = 1; for (int i = 1; i <= N; ++i) { for (int j = 1; j <= N; ++j) { dp[i][j] = sum[j][S[i]%j]; } for (int j = 1; j <= N; ++j) { sum[j][S[i]%j] += dp[i][j-1]; } } mint res = 0; for (int j = 1; j <= N; ++j) res += dp[N][j]; cout << res << endl; }