けんちょんの競プロ精進記録

競プロの精進記録や小ネタを書いていきます

yukicoder No.886 Direct

添字 GCD 畳み込みの練習に

問題へのリンク

問題概要

 H \times W の格子点上の二点対であって、その二点を結ぶ線分上に格子点をもたないものが何個あるかを数え上げよ。(1000000007 で割ったあまりで)

制約

  •  1 \le H, W \le 3 \times 10^{6}

解法 1:添字 GCD 畳み込み

この問題は、線分として  x 軸や  y 軸に平行な線分 ( W(H-1) + H(W-1) 個ある) を除くと、

 \sum_{{\rm GCD}(i, j) = 1} (H - i)(W - j)

を求める問題といえる。一般に各  k = 1, 2, \dots, K に対して

 f(k) = \sum_{{\rm GCD}(i, j) = k} g(i)h(j)

を求めるのは  O(K \log\log K) でできる。具体的には、

  •  F(k) = \sum_{i | k} f(i)
  •  G(k) = \sum_{i | k} g(i)
  •  H(k) = \sum_{j | k} h(i)

とすると、

 F(k) = G(k)H(k)

が成立するようだ。この

 F(k) = \sum_{i | k} f(i)

のような計算は、エラトステネスの篩の要領でできるようだ!!!

noshi91.hatenablog.com

qiita.com

そして逆演算も似たコードでできる。詳細は下コード参照。

#include <iostream>
#include <vector>
#include <algorithm>
using namespace std;

template<int MOD> struct Fp {
    long long val;
    constexpr Fp(long long v = 0) noexcept : val(v % MOD) {
        if (val < 0) v += MOD;
    }
    constexpr int getmod() { return MOD; }
    constexpr Fp operator - () const noexcept {
        return val ? MOD - val : 0;
    }
    constexpr Fp operator + (const Fp& r) const noexcept { return Fp(*this) += r; }
    constexpr Fp operator - (const Fp& r) const noexcept { return Fp(*this) -= r; }
    constexpr Fp operator * (const Fp& r) const noexcept { return Fp(*this) *= r; }
    constexpr Fp operator / (const Fp& r) const noexcept { return Fp(*this) /= r; }
    constexpr Fp& operator += (const Fp& r) noexcept {
        val += r.val;
        if (val >= MOD) val -= MOD;
        return *this;
    }
    constexpr Fp& operator -= (const Fp& r) noexcept {
        val -= r.val;
        if (val < 0) val += MOD;
        return *this;
    }
    constexpr Fp& operator *= (const Fp& r) noexcept {
        val = val * r.val % MOD;
        return *this;
    }
    constexpr Fp& operator /= (const Fp& r) noexcept {
        long long a = r.val, b = MOD, u = 1, v = 0;
        while (b) {
            long long t = a / b;
            a -= t * b; swap(a, b);
            u -= t * v; swap(u, v);
        }
        val = val * u % MOD;
        if (val < 0) val += MOD;
        return *this;
    }
    constexpr bool operator == (const Fp& r) const noexcept {
        return this->val == r.val;
    }
    constexpr bool operator != (const Fp& r) const noexcept {
        return this->val != r.val;
    }
    friend constexpr ostream& operator << (ostream &os, const Fp<MOD>& x) noexcept {
        return os << x.val;
    }
    friend constexpr istream& operator >> (istream &is, Fp<MOD>& x) noexcept {
        return is >> x.val;
    }
    friend constexpr Fp<MOD> modpow(const Fp<MOD> &a, long long n) noexcept {
        if (n == 0) return 1;
        auto t = modpow(a, n / 2);
        t = t * t;
        if (n & 1) t = t * a;
        return t;
    }
};


// f(k) = sum_{GCD(i, j) = k} g(i)h(j)
// F(k) = sum_{k | i} f(i)
template<class T> struct FastGCDConvolution {
    int N;
    vector<bool> is_prime;

    FastGCDConvolution(int N) : N(N), is_prime(N, true) {
        is_prime[0] = is_prime[1] = false;
        for (int p = 2; p < N; ++p) {
            if (!is_prime[p]) continue;
            for (int i = p*2; i < N; i += p)
                is_prime[i] = false;
        }
    }

    void zeta(vector<T> &v) {
        for (int p = 2; p < N; ++p) {
            if (!is_prime[p]) continue;
            for (int i = (N-1)/p; i >= 1; --i)
                v[i] += v[i*p];
        }
    }

    void mebius(vector<T> &v) {
        for (int p = 2; p < N; ++p) {
            if (!is_prime[p]) continue;
            for (int i = 1; i*p < N; ++i)
                v[i] -= v[i*p];
        }
    }

    vector<T> mult(vector<T> &a, vector<T> &b) {
        vector<T> c(N);
        zeta(a); zeta(b); 
        for (int i = 1; i < N; ++i) c[i] = a[i] * b[i];
        mebius(c);
        return c;
    }
};


using mint = Fp<1000000007>;

int main() {
    int H, W; cin >> H >> W;
    mint res = mint(H) * (W-1) + mint(W) * (H-1);

    int N = max(H, W);
    vector<mint> h(N, 0), w(N, 0), f(N, 0);
    for (int i = 1; i < H; ++i) h[i] = H - i;
    for (int i = 1; i < W; ++i) w[i] = W - i;
    
    FastGCDConvolution<mint> fz(N);
    f = fz.mult(h, w);
    res += f[1] * 2;
    cout << res << endl;
}