けんちょんの競プロ精進記録

競プロの精進記録や小ネタを書いていきます

AtCoder ABC 281 E - Least Elements (水色, 500 点)

よくあるデータ構造問題!! めっちゃ色んな解法がある!

問題概要

長さ  N の整数列  A_{0}, A_{1}, \dots, A_{N-1} と整数  M, K が与えられる (0-indexed で表している)。

 i = 0, 1, \dots, N-M に対して、次の問題に答えてください。


 M 個の整数  A_{i}, A_{i+1}, \dots, A_{i+M-1} を小さい順に並び替えたときの先頭  K 個の総和を求めよ。


制約

  •  1 \le K \le M \le N \le 2 \times 10^{5}
  •  1 \le A_{i} \le 10^{9}

考えたこと

要は次のクエリを高速に処理できるデータ構造があればよい。


  1.  x を挿入する
  2.  x を削除する (複数個ある場合は 1 個だけ削除する)
  3. 小さい方から数えて  k 番目の値を求める

このデータ構造を用いて、「値  A_{i} を push する」「値  A_{i} を pop する」という処理 (後述) をそれぞれ実装しておくことで、今回の問題は次のように解ける。

  • 最初に  A_{0}, A_{1}, \dots, A_{M-1} を push する
  •  i = 0, 1, \dots, N-M に対して
    • データ構造中の小さい順に  K 個の総和を出力する
    •  A_{i+M} を push する
    •  A_{i} を pop する

具体的には、以下のように実現できる。なお、変数 sum を、データ構造中の小さい順に  K 個の総和 ( K 個未満の場合はすべての総和) とする。

 A_{i} を push

データ構造に値  A_{i} を挿入して、sum += A[i] とする。

そしてこの操作によって「小さい順に  K 個以内」から追い出される数 v があれば、sum -= v とする。

 A_{i} を pop

データ構造から値  A_{i} を削除する。この値が「小さい順に  K 個以内」に含まれるならば、sum -= A[i] とする。

さらにこの操作によって「小さい順に  K 個以内」に新たに加わる数 v があれば、sum += v とする。

データ構造をどうするか

以上の push / pop においては、冒頭で述べた通り、次の 3 種類のクエリを高速に実行できる必要がある。

  1.  x を挿入する
  2.  x を削除する (複数個ある場合は 1 個だけ削除する)
  3. 小さい方から数えて  k 番目の値を求める

そのようなデータ構造は無数に考えられる。

  • multiset
  • 削除機能を備えた priority_queue
  • BIT 上二分探索の機能を備えた BIT
  • セグメント木
  • Binary Trie
  • Wavelet Matrix

 

解法 (1):multiset (C++)

最も高等知識を必要としない解法。

 K 番目の値を取得するためには、有名な方法がある。それは

  • 小さい順に  K 個を管理するための multiset:left
  • それ以上の値を管理するための multiset:right

とを 2 つ持つ戦法だ。値を挿入・削除するときには、うまく leftright とのバランスを取るように実装すればよい。なお、multiset  S 中の最小の要素は *S.begin()、最大の要素は *S.rbegin() で取得できる。

注意点として、C++ の multiset には有名な罠がある。multiset  S から値  x を削除したいときに、

S.erase(x);

と書いてしまうと、 S に含まれるすべての  x が削除されてしまうのだ。今回は  x を 1 個だけ削除したいので注意が必要だ。

正しくは、削除したいイテレータ (ここでは it とする) を求めて S.erase(it) のようにする必要がある。具体的には、関数 find() を用いて、

S.erase(S.find(x));

のように書けばよい!

全体として計算量は  O(N \log N) となる。

コード (解法 (1))

AC コードを開く

#include <bits/stdc++.h>
using namespace std;

int main() {
    // 入力
    long long N, M, K;
    cin >> N >> M >> K;
    vector<long long> A(N);
    for (int i = 0; i < N; ++i) cin >> A[i];

    // 小さい順に K 個の総和
    long long sum = 0;

    // multiset
    multiset<long long> left, right;

    auto push = [&](long long x) -> void {
        // とりあえず x を left に挿入する
        left.insert(x);
        sum += x;

        // left のサイズが K を超えるなら left の最大値を right に移す
        if (left.size() > K) {
            long long y = *left.rbegin();
            right.insert(y);
            sum -= y;
            left.erase(left.find(y));
        }
    };
    auto pop = [&](long long x) -> void {
        // とりあえず x を削除する
        if (left.count(x)) {
            left.erase(left.find(x));
            sum -= x;
        } else {
            right.erase(right.find(x));
        }

        // left のサイズが K 未満になるなら right の最小値を left に移す
        if (left.size() < K) {
            long long y = *right.begin();
            left.insert(y);
            sum += y;
            right.erase(right.find(y));
        }
    };

    for (int i = 0; i < M; ++i) push(A[i]);
    for (int i = 0; i < N - M + 1; ++i) {
        cout << sum << " ";
        if (i+M < N) push(A[i+M]), pop(A[i]);
    }
    cout << endl;
}

 

解法 (2):削除機能を備えた priority_queue

multiset と同様に、priority_queue を用いて  K 番目の値を管理するためには、

  • 小さい順に  K 個を管理するための priority_queue (最大の値を取得できるようにする):left
  • それ以上の値を管理するための priority_queue (最小の値を取得できるようにする):right

を用意する方法が有名だ。

しかし、priority_queue で実現するにあたって一つ障壁がある。それは「priority_queue から値  x を削除したいときどうするのか」という部分だ。

通常の priority_queue que では「最大の値」「最小の値」しか削除できない。この問題を乗り越えるために、削除したい値を予約しておく priority_queue del を別に用意しておく。そして、que から「最大の値」を取得するときに、次の疑似コードのように「取得した値が del で予約された値と一致するかどうかを確認し、一致するならば棄却する」ようにすればよい。

// 削除機能を持たせた priority_queue
priority_queue<int> que, del;

// 挿入
void push(int x) { que.push(x); }

// 削除
void pop(int x) { del.push(x); }

// 最大の値を取得 (ここでは最大の値の削除はしない)
int get() {
    while (!del.empty() && que.top() == del.top()) {
        que.pop();
        del.pop();
    }
    return que.top();
}

この方法を活用して、priority_queue を合計 4 個用意することで、この問題は  O(N \log N) で解ける。

コード (解法 (2))

AC コードを開く

#include <bits/stdc++.h>
using namespace std;

int main() {
    // 入力
    long long N, M, K;
    cin >> N >> M >> K;
    vector<long long> A(N);
    for (int i = 0; i < N; ++i) cin >> A[i];

    // 小さい順に K 個の総和
    long long sum = 0;

    // proiroty_queue
    priority_queue<long long> left, dleft;
    priority_queue<long long, vector<long long>, greater<long long>> right, dright;

    // 境界値を取得する
    auto get_left = [&]() -> long long {
        while (!dleft.empty() && left.top() == dleft.top()) {
            left.pop(); dleft.pop();
        }
        return left.top();
    };
    auto get_right = [&]() -> long long {
        while (!dright.empty() && right.top() == dright.top()) {
            right.pop(); dright.pop();
        }
        return right.top();
    };

    // push と pop
    auto push = [&](long long x) -> void {
        // とりあえず x を left に挿入する
        left.push(x);
        sum += x;

        // left のサイズが K を超えるなら left の最大値を right に移す
        if (left.size() - dleft.size() > K) {
            long long y = get_left();
            sum -= y;
            left.pop();
            right.push(y);
        }
    };
    auto pop = [&](long long x) -> void {
        // とりあえず x を削除する
        if (x <= get_left()) {
            dleft.push(x);
            sum -= x;
        } else {
            dright.push(x);
        }

        // left のサイズが K 未満になるなら right の最小値を left に移す
        if (left.size() - dleft.size() < K) {
            long long y = get_right();
            sum += y;
            right.pop();
            left.push(y);
        }
    };

    for (int i = 0; i < M; ++i) push(A[i]);
    for (int i = 0; i < N - M + 1; ++i) {
        cout << sum << " ";
        if (i+M < N) push(A[i+M]), pop(A[i]);
    }
    cout << endl;
}

 

解法 (3):BIT 上二分探索の機能を備えた BIT

ここから先は高級なデータ構造を使う!

「挿入」「削除」「 K 番目を取得」クエリを処理するのに BIT (Binary Indexed Tree) を使うとよいケースも多い。ただし、挿入する値は  0 以上  10^{6} (程度) 以下の整数でなければならない。BIT 内部で用意する配列 dat に対して、値 x を挿入するときは dat[x] にアクセスするためだ。

そこで、今回の問題では座標圧縮をする。配列  A の各値を小さい順に番号付ける。それにより、 A の各値は  0, 1, \dots, N-1 を並び替えたものになる (今回はタイは潰さない)。これで BIT が使えるようになる。

なお、BIT を用いて具体的に「挿入」「削除」「 K 番目を取得」を実行する方法については、たとえば次の資料などを参考に。 K 番目の値を取得する部分については、「BIT 上の二分探索」がキーワード。

algo-logic.info

コード (解法 (3))

小さい順に  K 個の総和を求める部分では、これまでのように変数 sum を用いてもよいが、下コードのように、総和を求めるための専用の BIT 変数をもう 1 つ用意する方が簡便だと思う!

AC コードを開く

#include <bits/stdc++.h>
using namespace std;

// get(k): binary search on BIT
template <class Abel> struct BIT {
    Abel UNITY_SUM = 0;
    vector<Abel> dat;
    
    // [0, n)
    BIT(int n, Abel unity = 0) : UNITY_SUM(unity), dat(n, unity) { }
    void init(int n) {
        dat.assign(n, UNITY_SUM);
    }
    
    // a is 0-indexed
    inline void add(int a, Abel x) {
        for (int i = a; i < (int)dat.size(); i |= i + 1)
            dat[i] = dat[i] + x;
    }
    
    // [0, a), a is 0-indexed
    inline Abel sum(int a) {
        Abel res = UNITY_SUM;
        for (int i = a - 1; i >= 0; i = (i & (i + 1)) - 1)
            res = res + dat[i];
        return res;
    }
    
    // [a, b), a and b are 0-indexed
    inline Abel sum(int a, int b) {
        return sum(b) - sum(a);
    }

    // k-th number (k is 0-indexed)
    int get(long long k) {
        ++k;
        int res = 0;
        int N = 1;
        while (N < (int)dat.size()) N *= 2;
        for (int i = N / 2; i > 0; i /= 2) {
            if (res + i - 1 < (int)dat.size() && dat[res + i - 1] < k) {
                k = k - dat[res + i - 1];
                res = res + i;
            }
        }
        return res;
    }
    
    // debug
    void print() {
        for (int i = 0; i < (int)dat.size(); ++i)
            cout << sum(i, i + 1) << ",";
        cout << endl;
    }
};

int main() {
    // 入力
    long long N, M, K;
    cin >> N >> M >> K;
    vector<long long> A(N);
    for (int i = 0; i < N; ++i) cin >> A[i];

    // 座標圧縮を準備
    vector<pair<long long,int>> comp(N);
    for (int i = 0; i < N; ++i) comp[i] = {A[i], i};
    sort(comp.begin(), comp.end());
    vector<int> order(N);
    for (int i = 0; i < N; ++i) order[comp[i].second] = i;

    // BIT
    BIT<long long> bit(N + 1), sum(N + 1);

    // push と pop
    auto push = [&](long long x, int id) -> void {
        bit.add(id, 1);
        sum.add(id, x);
    };
    auto pop = [&](long long x, int id) -> void {
        bit.add(id, -1);
        sum.add(id, -x);
    };
    auto get = [&]() -> long long {
        int kthid = bit.get(K-1);
        return sum.sum(kthid+1);
    };

    for (int i = 0; i < M; ++i) push(A[i], order[i]);
    for (int i = 0; i < N - M + 1; ++i) {
        cout << get() << " ";
        if (i+M < N) {
            push(A[i+M], order[i+M]); 
            pop(A[i], order[i]);
        }
    }
    cout << endl;
}

 

解法 (4):セグメント木

BIT で解けるならセグメント木でも解ける。解法 (3) で準備した 2 つの BIT を相当して、

  • 各ノードの値:(挿入された値の個数, 挿入された値の総和)
  • ノード間の演算:(挿入された値の個数の和, 挿入された値の総和の和)

によって定義されたセグメント木を用意する。

「小さい順に  K 個の総和」を求めるクエリを処理するためには次のようにする。

  1. 区間  \lbrack 0, r) に対するセグメント木の取得値の第一要素が  K 以下になるような最大の  r を求める (セグメント木上の二分探索で求められる)
  2. 1 で求めた  r に対して、区間  \lbrack 0, r) に対するセグメントの取得値の第二要素を答える

コード (解法 (4))

ACL を用いた。ACL には、セグメント木上の二分探索を実行する関数 max_right() も用意されている。

AC コードを開く

#include <bits/stdc++.h>
#include <atcoder/segtree>
using namespace std;
using namespace atcoder;

// セグメント木の設定
using Monoid = pair<long long, long long>;
Monoid op(Monoid a, Monoid b) {
    return {a.first + b.first, a.second + b.second};
};
Monoid e(){return {0, 0};}

int main() {
    // 入力
    long long N, M, K;
    cin >> N >> M >> K;
    vector<long long> A(N);
    for (int i = 0; i < N; ++i) cin >> A[i];

    // 座標圧縮を準備
    vector<pair<long long,int>> comp(N);
    for (int i = 0; i < N; ++i) comp[i] = {A[i], i};
    sort(comp.begin(), comp.end());
    vector<int> order(N);
    for (int i = 0; i < N; ++i) order[comp[i].second] = i;

    // セグメント木
    segtree<Monoid, op, e> seg(N);

    // セグメント木上の二分探索を実行するための関数
    auto f = [&](Monoid x) -> bool { return x.first <= K; };

    // push と pop
    auto push = [&](long long x, int id) -> void {
        seg.set(id, Monoid(1, x));
    };
    auto pop = [&](long long x, int id) -> void {
        seg.set(id, e());
    };
    auto get = [&]() -> long long {
        int r = seg.max_right(0, f);
        return seg.prod(0, r).second;
    };

    for (int i = 0; i < M; ++i) push(A[i], order[i]);
    for (int i = 0; i < N - M + 1; ++i) {
        cout << get() << " ";
        if (i+M < N) {
            push(A[i+M], order[i+M]); 
            pop(A[i], order[i]);
        }
    }
    cout << endl;
}

 

解法 (5):Binary Trie

「挿入」「削除」「 K 番目の値を取得」ができるデータ構造はまだまだある。

挿入する値が非負整数値ならば、Binary Trie も有力。詳細はここでは省略。

コード (解法 (5))

AC コードを開く

#include <bits/stdc++.h>
using namespace std;

// Binary Trie
template<typename INT, size_t MAX_DIGIT> struct BinaryTrie {
    struct Node {
        size_t count;
        Node *prev, *left, *right;
        Node(Node *prev) : count(0), prev(prev), left(nullptr), right(nullptr) {}
    };
    INT lazy;
    Node *root;

    // constructor
    BinaryTrie() : lazy(0), root(emplace(nullptr)) {}
    inline size_t get_count(Node *v) const { return v ? v->count : 0; }
    inline size_t size() const { return get_count(root); }

    // add and get value of Node
    inline void add(INT val) {
        lazy ^= val;
    }
    inline INT get(Node *v) {
        if (!v) return -1;
        INT res = 0;
        for (int i = 0; i < MAX_DIGIT; ++i) {
            if (v == v->prev->right)
                res |= INT(1)<<i;
            v = v->prev;
        }
        return res ^ lazy;
    }

    // find Node* whose value is val
    Node* find(INT val) {
        INT nval = val ^ lazy;
        Node *v = root;
        for (int i = MAX_DIGIT-1; i >= 0; --i) {
            bool flag = (nval >> i) & 1;
            if (flag) v = v->right;
            else v = v->left;
            if (!v) return v;
        }
        return v;
    }

    // insert
    inline Node* emplace(Node *prev) {
        return new Node(prev);
    }
    void insert(INT val, size_t k = 1) {
        INT nval = val ^ lazy;
        Node *v = root;
        for (int i = MAX_DIGIT-1; i >= 0; --i) {
            bool flag = (nval >> i) & 1;
            if (flag && !v->right) v->right = emplace(v);
            if (!flag && !v->left) v->left = emplace(v);
            if (flag) v = v->right;
            else v = v->left;
        }
        v->count += k;
        while ((v = v->prev)) v->count = get_count(v->left) + get_count(v->right);
    }
    
    // erase
    Node* clear(Node *v) {
        if (!v || get_count(v)) return v;
        delete(v);
        return nullptr;
    }
    bool erase(Node *v, size_t k = 1) {
        if (!v) return false;
        v->count -= k;
        while ((v = v->prev)) {
            v->left = clear(v->left);
            v->right = clear(v->right);
            v->count = get_count(v->left) + get_count(v->right);
        }
        return true;
    }
    bool erase(INT val) {
        auto v = find(val);
        return erase(v);
    }

    // max (with xor-addition of val) and min (with xor-addition of val)
    Node* get_max(INT val = 0) {
        INT nval = val ^ lazy;
        Node* v = root;
        for (int i = MAX_DIGIT-1; i >= 0; --i) {
            bool flag = (nval >> i) & 1;
            if (!v->right) v = v->left;
            else if (!v->left) v = v->right;
            else if (flag) v = v->left;
            else v = v->right;
        }
        return v;
    }
    Node* get_min(INT val = 0) {
        return get_max(~val & ((INT(1)<<MAX_DIGIT)-1));
    }
   
    // lower_bound, upper_bound
    Node* get_cur_node(Node *v, int i) {
        if (!v) return v;
        Node *left = v->left, *right = v->right;
        if ((lazy >> i) & 1) swap(left, right);
        if (left) return get_cur_node(left, i+1);
        else if (right) return get_cur_node(right, i+1);
        return v;
    }
    Node* get_next_node(Node *v, int i) {
        if (!v->prev) return nullptr;
        Node *left = v->prev->left, *right = v->prev->right;
        if ((lazy >> (i+1)) & 1) swap(left, right);
        if (v == left && right) return get_cur_node(right, i);
        else return get_next_node(v->prev, i+1);
    }
    Node* lower_bound(INT val) {
        INT nval = val ^ lazy;
        Node *v = root;
        for (int i = MAX_DIGIT-1; i >= 0; --i) {
            bool flag = (nval >> i) & 1;
            if (flag && v->right) v = v->right;
            else if (!flag && v->left) v = v->left;
            else if ((val >> i) & 1) return get_next_node(v, i);
            else return get_cur_node(v, i);
        }
        return v;
    }
    Node* upper_bound(INT val) {
        return lower_bound(val + 1);
    }
    size_t order_of_val(INT val) {
        Node *v = root;
        size_t res = 0;
        for (int i = MAX_DIGIT-1; i >= 0; --i) {
            Node *left = v->left, *right = v->right;
            if ((lazy >> i) & 1) swap(left, right);
            bool flag = (val >> i) & 1;
            if (flag) {
                res += get_count(left);
                v = right;
            }
            else v = left;
        }
        return res;
    }

    // k-th, k is 0-indexed
    Node* get_kth(size_t k, INT val = 0) {
        Node *v = root;
        if (get_count(v) <= k) return nullptr;
        for (int i = MAX_DIGIT-1; i >= 0; --i) {
            bool flag = (lazy >> i) & 1;
            Node *left = (flag ? v->right : v->left);
            Node *right = (flag ? v->left : v->right);
            if (get_count(left) <= k) k -= get_count(left), v = right;
            else v = left;
        }
        return v;
    }

    // debug
    void print(Node *v, string prefix = "") {
        if (!v) return;
        cout << prefix << ": " << v->count << endl;
        print(v->left, prefix + "0");
        print(v->right, prefix + "1");
    }
    void print() {
        print(root);
    }
    vector<INT> eval(Node *v, int digit) const {
        vector<INT> res;
        if (!v) return res;
        if (!v->left && !v->right) {
            for (int i = 0; i < get_count(v); ++i) res.push_back(0);
            return res;
        }
        const auto& left = eval(v->left, digit-1);
        const auto& right = eval(v->right, digit-1);
        for (auto val : left) res.push_back(val);
        for (auto val : right) res.push_back(val + (INT(1)<<digit));
        return res;
    }
    vector<INT> eval() const {
        auto res = eval(root, MAX_DIGIT-1);
        for (auto &val : res) val ^= lazy;
        return res;
    }
    friend ostream& operator << (ostream &os,
                                 const BinaryTrie<INT, MAX_DIGIT> &bt) {
        auto res = bt.eval();
        for (auto val : res) os << val << " ";
        return os;
    }
};

int main() {
    // 入力
    long long N, M, K;
    cin >> N >> M >> K;
    vector<long long> A(N);
    for (int i = 0; i < N; ++i) cin >> A[i];

    // 小さい順に K 個の総和
    long long sum = 0;

    // Binary Trie
    BinaryTrie<int, 30> left, right;

    // push と pop
    auto push = [&](long long x) -> void {
        // とりあえず x を left に挿入する
        left.insert(x);
        sum += x;

        // left のサイズが K を超えるなら left の最大値を right に移す
        if (left.size() > K) {
            long long y = left.get(left.get_max());
            sum -= y;
            left.erase(y);
            right.insert(y);
        }
    };
    auto pop = [&](long long x) -> void {
        // とりあえず x を削除する
        if (x <= left.get(left.get_max())) {
            left.erase(x);
            sum -= x;
        } else {
            right.erase(x);
        }

        // left のサイズが K 未満になるなら right の最小値を left に移す
        if (left.size() < K) {
            long long y = right.get(right.get_min());
            sum += y;
            left.insert(y);
            right.erase(y);
        }
    };

    for (int i = 0; i < M; ++i) push(A[i]);
    for (int i = 0; i < N - M + 1; ++i) {
        cout << sum << " ";
        if (i+M < N) push(A[i+M]), pop(A[i]);
    }
    cout << endl;
}

 

解法 (6):Wavelet Matrix

ユーザ解説 by rsk0315 にて、上位互換問題が Wavelet Matrix で解けることが指摘されている。

コード (解法 (6))

AC コードを開く

#include <bits/stdc++.h>
using namespace std;


// Bit Vector
struct BitRank {
    // block: bit vector
    // count: the number of 1 within each block
    vector<unsigned long long> block;
    vector<unsigned int> count;
    
    // constructor
    BitRank() {}
    void resize(const unsigned int num) {
        block.resize(((num + 1) >> 6) + 1, 0);
        count.resize(block.size(), 0);
    }
    
    // set val(0 or 1) onto i-th bit
    void set(const unsigned int i, const unsigned long long val) {
        block[i >> 6] |= (val << (i & 63));
    }
    void build() {
        for (unsigned int i = 1; i < block.size(); i++) {
            count[i] = count[i - 1] + __builtin_popcountll(block[i - 1]);
        }
    }
    
    // the number of 1 in [0, i)
    unsigned int rank1(const unsigned int i) const {
        return count[i >> 6] +
        __builtin_popcountll(block[i >> 6] & ((1ULL << (i & 63)) - 1ULL));
    }
    // the number of 1 in [i, j)
    unsigned int rank1(const unsigned int i, const unsigned int j) const {
        return rank1(j) - rank1(i);
    }
    // the number of 0 in [0, i)
    unsigned int rank0(const unsigned int i) const {
        return i - rank1(i);
    }
    // the number of 0 in [i, j)
    unsigned int rank0(const unsigned int i, const unsigned int j) const {
        return rank0(j) - rank0(i);
    }
};

// Wavelet Matrix
template<class T> struct WaveletMatrix {
    // inner data
    int height;
    vector<BitRank> bv;
    vector<int> pos;
    vector<vector<long long>> rui;

    // constructor (sigma: the number of characters)
    WaveletMatrix() {}
    WaveletMatrix(vector<T> vec) :
        WaveletMatrix(vec, *max_element(vec.begin(), vec.end()) + 1) {}
    WaveletMatrix(vector<T> vec, T sigma) {
        init(vec, sigma);
    }
    void init(vector<T> &vec, T sigma) {
        height = (sigma == 1) ? 1 : (64 - __builtin_clzll(sigma - 1));
        bv.resize(height), pos.resize(height);
        vector<T> A = vec;
        rui.resize(height + 1);
        for (int i = 0; i < height; ++i) {
            bv[i].resize(vec.size());
            for (int j = 0; j < vec.size(); ++j) {
                bv[i].set(j, get(vec[j], height - i - 1));
            }
            bv[i].build();
            auto it = stable_partition(vec.begin(), vec.end(), [&](int c) {
                return !get(c, height - i - 1);
            });
            pos[i] = it - vec.begin();
        }
        for (int i = 0; i <= height; ++i) {
            rui[i].resize((int)A.size() + 1);
            for (int j = 1; j <= (int)A.size(); ++j) {
                rui[i][j] = rui[i][j - 1] + A[j - 1];
            }
            if (i == height) break;
            stable_partition(A.begin(), A.end(), [&](int c) {
                return !get(c, height - i - 1);
            });
        }
    }
    
    // the i-th bit of "val" (0 or 1)
    int get(const T val, const int i) {
        return val >> i & 1;
    }
    
    // the number of "val" in [l, r)
    int rank(const T val, const int l, const int r) {
        return rank(val, r) - rank(val, l);
    }
    
    // the number of "val" in [0, i)
    int rank(T val, int i) {
        int p = 0;
        for (int j = 0; j < height; ++j) {
            if (get(val, height - j - 1)) {
                p = pos[j] + bv[j].rank1(p);
                i = pos[j] + bv[j].rank1(i);
            } else {
                p = bv[j].rank0(p);
                i = bv[j].rank0(i);
            }
        }
        return i - p;
    }
    
    // the k-th (0-indexed) smallest value in [l, r)
    T k_th_smallest(int k, int l, int r) {
        T res = 0;
        for (int i = 0; i < height; ++i) {
            const int j = bv[i].rank0(l, r);
            if (j > k){
                l = bv[i].rank0(l);
                r = bv[i].rank0(r);
            } else {
                l = pos[i] + bv[i].rank1(l);
                r = pos[i] + bv[i].rank1(r);
                k -= j;
                res |= (1LL << (height - i - 1));
            }
        }
        return res;
    }
    
    // the k-th (0-indexed) largest value in [l, r)
    T k_th_largest(int l, int r, int k) {
       return k_th_smallest(l, r, r - l - k - 1);
    }
    
    // the sum of the top-k sum in [l, r)
    T top_k_sum(int k, int l, int r) {
        if (l == r) return 0;
        T res = 0, val = 0;
        for (int i = 0; i < height; ++i) {
            const int j = bv[i].rank0(l, r);
            if (j > k) {
                l = bv[i].rank0(l);
                r = bv[i].rank0(r);
            } else {
                int l2 = bv[i].rank0(l);
                int r2 = bv[i].rank0(r);
                res += rui[i + 1][r2] - rui[i + 1][l2];
                l = pos[i] + bv[i].rank1(l);
                r = pos[i] + bv[i].rank1(r);
                k -= j;
                val |= (1LL << (height - i - 1));
            }
        }
        res += (long long)val * k;
        return res;
    }
    
    // the number of value between [loewr, upper) in [l, r)
    int range_freq(const int i, const int j, const T lower, const T upper,
                   const int l, const int r, const int x) {
        if (i == j || r <= lower || upper <= l) return 0;
        int mid = (l + r) >> 1;
        if (lower <= l && r <= upper) {
            return j - i;
        } else {
            T left = range_freq(bv[x].rank0(i), bv[x].rank0(j), lower, upper, l, mid, x + 1);
            T right = range_freq(pos[x] + bv[x].rank1(i), pos[x] + bv[x].rank1(j),
                                 lower, upper, mid, r, x + 1);
            return left + right;
        }
    }
    int range_freq(const int l, const int r, const T lower, const T upper){
        return range_freq(l, r, lower, upper, 0, 1LL << height, 0);
    }
    
    // the minmum value between [lower, upper) in [l, r)
    int range_min(const int i, const int j, const T lower, const T upper,
                  const int l, const int r, const int x, const int val){
        if (i == j || r <= lower || upper <= l) return -1;
        if (r - l == 1) return val;
        int mid = (l + r) >> 1;
        int res = range_min(bv[x].rank0(i), bv[x].rank0(j), lower, upper, l, mid, x + 1, val);
        if (res < 0) {
            return range_min(pos[x] + bv[x].rank1(i), pos[x] + bv[x].rank1(j),
                             lower, upper, mid, r, x + 1, val + (1LL << (height - x - 1)));
        } else return res;
    }
    int range_min(int l, int r, T lower, T upper) {
        return range_min(l, r, lower, upper, 0, 1LL << height, 0, 0);
    }
    
    // the max value (< val) in [l, r)
    T prev_value(int l, int r, T val) {
        int num = range_freq(l, r, 0, val);
        if (num == 0) return T(-1);
        else return k_th_smallest(l, r, num - 1);
    }
    
    // the min value (>= val) in [l, r)
    T next_value(int l, int r, T val) {
        int num = range_freq(l, r, 0, val);
        if (num == r - l) return T(-1);
        else return k_th_smallest(l, r, num);
    }
};

//
template<class T> struct OrthogonalRangeCount {
    // inner data
    using ptt = pair<T, T>;
    const int sz;
    vector<T> X, Y;
    WaveletMatrix<T> wm;
    
    // constructor
    OrthogonalRangeCount(vector<ptt> candidate) : sz((int)candidate.size()), X(sz), Y(sz) {
        sort(candidate.begin(), candidate.end());
        vector<int> vec(sz);
        for (int i = 0; i < sz; ++i) {
            X[i] = candidate[i].first, Y[i] = candidate[i].second;
        }
        sort(Y.begin(), Y.end());
        Y.erase(unique(Y.begin(), Y.end()), Y.end());
        for (int i = 0; i < sz; ++i) {
            vec[i] = lower_bound(Y.begin(), Y.end(), candidate[i].second) - Y.begin();
        }
        wm.init(vec, Y.size());
    }
    
    // the number of points in [lx, rx) × [ly, ry)
    int query(const T lx, const T ly, const T rx, const T ry){
        const int lxid = lower_bound(X.begin(), X.end(), lx) - X.begin();
        const int rxid = lower_bound(X.begin(), X.end(), rx) - X.begin();
        const int lyid = lower_bound(Y.begin(), Y.end(), ly) - Y.begin();
        const int ryid = lower_bound(Y.begin(), Y.end(), ry) - Y.begin();
        if (lxid >= rxid || lyid >= ryid) return 0;
        return wm.range_freq(lxid, rxid, lyid, ryid);
    }
};

void ABC_281_E() {
    int N, M, K;
    cin >> N >> M >> K;
    vector<long long> A(N);
    for (int i = 0; i < N; ++i) cin >> A[i];
    
    WaveletMatrix wm(A);
    for (int i = 0; i < N - M + 1; ++i) {
        cout << wm.top_k_sum(K, i, i + M) << " ";
    }
    cout << endl;
}

int main() {
    ABC_281_E();
}