2020-11-06

AtCoder AGC 038 C - LCMs (黄色, 700 点)

AtCoder AtCoder700点 AGC-C 添字GCD畳み込みエラトステネスの篩高速ゼータ変換高速メビウス変換高速畳み込み計算数学(整数問題) 数列約数系包除調和級数バケット集計処理最大公約数最大公約数の値を固定して考える制約:数値が10^6以下解空間:O(N^2)通りの選択肢総和を求める黄色diff メビウス関数解空間:O(N^2)個のペア

添字 GCD convolution が一躍話題になった問題だった気がする

問題へのリンク

問題概要

長さ $N$ の整数列 $A_{0}, A_{1}, \dots, A_{N−1}$ がある。

$\sum_{0 \le i \lt j \le N-1} {\rm lcm}(A_{i}, A_{j})$

の値を 998244353 で割ったあまりを求めよ。

制約

$1 \le N \le 2 \times 10^{5}$
$1 \le A_{i} \le 10^{6}$

考えたこと

$N$ 個の値のうちのすべてのペアに対するなにかの総和を求める問題では

$0 \le i, j \le N-1$ を満たす $(i, j)$ についての総和を求めて
$0 \le i = j \le N-1$ を満たす $(i, j)$ についての結果を引いて
2 で割る

という流れが定石ではある。こうすることでいくぶん考えやすくなる。

さて、GCD や LCM に関する問題を考えるときは「最大公約数を固定して考える」というのが一つの定石ではある気がする。登場する数値の上限値を $V = 1000000$ とする。各 $g = 1, 2, \dots, 1000000$ に対して、

${\rm gcd}(A_{i}, A_{j}) = g$

となるような $(A_{i}, A_{j}$ について考えたい。ここは数列をヒストグラム化した方が考えやすそうなのでそうする。つまり

$f_{v}$ = $v$ が何個あるか

という風に変換した配列 $f$ を考えることにする。このとき、求める総和は次のように書き直せる。

$\sum_{{\rm gcd}(u, v) = g} f_{v} \times f_{v} \times \frac{uv}{g}$
$= \sum_{{\rm gcd}(u, v) = g} (u f_{u})(v f_{v}) / g$

これはまさに、添字 GCD 畳み込みの形になっている。

添字 GCD 畳み込み

一般に、

$h(k) = \sum_{{\rm gcd}(u, v) = k} f(u)g(v)$

を求めたいとき、

$F(k) = \sum_{k | i} f(i)$
$G(k) = \sum_{k | i} g(i)$
$H(k) = \sum_{k | i} h(i)$

とすると、

$H(k) = F(k)G(k)$

が成立する！そして $f$ から $F$ を得るのは、エラトステネスの篩の要領で $O(V \log \log V)$ でできる ( $f$ の次数を $V$ とする)。こうして $H$ を求めて、それを逆変換で $h$ を得るのも同じ計算量でできる。これらの理論については、以下の記事に詳しい。

qiita.com

今回

今回は、各 $g = 1, 2, \dots, V$ に対して

$\frac{1}{g} \sum_{{\rm gcd}(u, v) = g} (u f_{u})(v f_{v})$

の値を求めて、その総和を求めたい。これは、 $v$ 次の係数が $vf(v)$ であるような 2 つの多項式についての、添字 GCD 畳み込みをすることで求められる。よって計算量は $O(N + V \log \log V)$ となる。

#include <bits/stdc++.h>
using namespace std;

// f(k) = sum_{GCD(i, j) = k} g(i)h(j)
// F(k) = sum_{k | i} f(i)
// F(k) = G(k)H(k)
namespace FastGCDConvolution {
    vector<bool> eratos(int N) {
        vector<bool> isprime(N, true);
        isprime[0] = isprime[1] = false;
        for (int p = 2; p < N; ++p) {
            if (!isprime[p]) continue;
            for (int i = p*2; i < N; i += p)
                isprime[i] = false;
        }
        return isprime;
    }

    template<class T> void zeta(vector<T> &v, const vector<bool> &isprime) {
        int N = (int)v.size();
        for (int p = 2; p < N; ++p) {
            if (!isprime[p]) continue;
            for (int i = (N-1)/p; i >= 1; --i)
                v[i] += v[i*p];
        }
    }

    template<class T> void mebius(vector<T> &v, const vector<bool> &isprime) {
        int N = (int)v.size();
        for (int p = 2; p < N; ++p) {
            if (!isprime[p]) continue;
            for (int i = 1; i*p < N; ++i)
                v[i] -= v[i*p];
        }
    }

    template<class T> vector<T> mul(const vector<T> &a, const vector<T> &b) {
        int N = max((int)a.size(), (int)b.size());
        const auto &isprime = eratos(N);
        vector<T> A(N, 0), B(N, 0);
        for (int i = 0; i < a.size(); ++i) A[i] = a[i];
        for (int i = 0; i < b.size(); ++i) B[i] = b[i];
        zeta(A, isprime), zeta(B, isprime);
        vector<T> C(N);
        for (int i = 1; i < N; ++i) C[i] = A[i] * B[i];
        mebius(C, isprime);
        return C;
    }
};


// modint
template<int MOD> struct Fp {
    long long val;
    constexpr Fp(long long v = 0) noexcept : val(v % MOD) {
        if (val < 0) val += MOD;
    }
    constexpr int getmod() const { return MOD; }
    constexpr Fp operator - () const noexcept {
        return val ? MOD - val : 0;
    }
    constexpr Fp operator + (const Fp& r) const noexcept { return Fp(*this) += r; }
    constexpr Fp operator - (const Fp& r) const noexcept { return Fp(*this) -= r; }
    constexpr Fp operator * (const Fp& r) const noexcept { return Fp(*this) *= r; }
    constexpr Fp operator / (const Fp& r) const noexcept { return Fp(*this) /= r; }
    constexpr Fp& operator += (const Fp& r) noexcept {
        val += r.val;
        if (val >= MOD) val -= MOD;
        return *this;
    }
    constexpr Fp& operator -= (const Fp& r) noexcept {
        val -= r.val;
        if (val < 0) val += MOD;
        return *this;
    }
    constexpr Fp& operator *= (const Fp& r) noexcept {
        val = val * r.val % MOD;
        return *this;
    }
    constexpr Fp& operator /= (const Fp& r) noexcept {
        long long a = r.val, b = MOD, u = 1, v = 0;
        while (b) {
            long long t = a / b;
            a -= t * b, swap(a, b);
            u -= t * v, swap(u, v);
        }
        val = val * u % MOD;
        if (val < 0) val += MOD;
        return *this;
    }
    constexpr bool operator == (const Fp& r) const noexcept {
        return this->val == r.val;
    }
    constexpr bool operator != (const Fp& r) const noexcept {
        return this->val != r.val;
    }
    friend constexpr istream& operator >> (istream& is, Fp<MOD>& x) noexcept {
        is >> x.val;
        x.val %= MOD;
        if (x.val < 0) x.val += MOD;
        return is;
    }
    friend constexpr ostream& operator << (ostream& os, const Fp<MOD>& x) noexcept {
        return os << x.val;
    }
    friend constexpr Fp<MOD> modpow(const Fp<MOD>& r, long long n) noexcept {
        if (n == 0) return 1;
        if (n < 0) return modpow(modinv(r), -n);
        auto t = modpow(r, n / 2);
        t = t * t;
        if (n & 1) t = t * r;
        return t;
    }
    friend constexpr Fp<MOD> modinv(const Fp<MOD>& r) noexcept {
        long long a = r.val, b = MOD, u = 1, v = 0;
        while (b) {
            long long t = a / b;
            a -= t * b, swap(a, b);
            u -= t * v, swap(u, v);
        }
        return Fp<MOD>(u);
    }
};

const int MOD = 998244353;
using mint = Fp<MOD>;


int main() {
    const int MAX = 1000001;
    int N;
    cin >> N;
    vector<long long> A(N);
    for (int i = 0; i < N; ++i) cin >> A[i];
    vector<mint> F(MAX, 0);
    for (int i = 0; i < N; ++i) F[A[i]] += 1;
    for (int x = 1; x < MAX; ++x) F[x] *= x;
    auto FF = FastGCDConvolution::mul(F, F);
    mint res = 0;
    for (int x = 1; x < MAX; ++x) res += FF[x] / x;
    for (int i = 0; i < N; ++i) res -= A[i];
    cout << res / 2 << endl;
}