№	Пользователь	Рейтинг
1	tourist	4009
2	jiangly	3823
3	Benq	3738
4	Radewoosh	3633
5	jqdai0815	3620
6	orzdevinwang	3529
7	ecnerwala	3446
8	Um_nik	3396
9	ksun48	3390
10	gamegame	3386

№	Пользователь	Вклад
1	cry	167
2	Um_nik	163
3	maomao90	162
3	atcoder_official	162
5	adamant	159
6	-is-this-fft-	158
7	awoo	157
8	TheScrasse	154
9	Dominater069	153
9	nor	153

Всем привет! Хочу рассказать о достаточно простом приеме (не знаю как называется) для оптимизации динамики. Очень часто бывает так, что при пересчете нам надо искать минимум в какой-нибудь уже посчитанной таблице, но при этом игнорируя некоторое конечное количество строк и столбцов; как оптимизировать такое и подобное, описано в блоге.

Постановка задачи

Итак, у нас есть таблица, предположим, что большая — $$$N \times N$$$, и мы хотим сделать какое-то большое количество запросов вида «Найди максимальное значение в таблице, которое не лежит в столбцах из множества $$$C$$$ и строках из множества $$$R$$$», при этом для каждого запроса гарантируется, что $$$max ( |C|, |R| ) \leq K$$$, где $$$K$$$ -- какая-то очень маленькая константа. Эту задачу мы бы могли решать, например, с помощью двумерного ДО -- но это работает долго и занимает гораздо больше памяти.

Решается задача просто, давайте для начала, найдем $$$x_1$$$ — глобальный максимум в таблице и запомним его позицию $$$(i_1, j_1)$$$. Далее, при дальнейших запросах, возможен вариант, что либо $$$i_1 \in C$$$, либо $$$j_1 \in R$$$, поэтому давайте запустим два рекурсивных вызова, с поиском максимума в таблице, в одном из них запретив строку $$$i_1$$$, а в другом -- столбец $$$j_1$$$. Таким образом каждая рекурсивная функция считает максимум, в случае, если мы запрещаем столбцы $$$C'$$$ и строки $$$R'$$$. Заметим, что при $$$C' > k$$$ и $$$R' > k$$$ значения нам считать не надо, так что можно смело обрывать рекурсию.

реализация

struct Candidate {
    int value;
    int x, y;

    bool operator < (const Candidate& c) const {
        return value < c.value;
    }
};

Candidate get_neutral_candidate() {
    return Candidate { numeric_limits<int>::min(), -1, -1 };
}

struct CandidateSet {
    vector<Candidate> v;
    vector<pair<int, int>> go;

    // data -- исходный массив
    // kx -- максимальное количество запретов по строкам
    // ky -- максимальное количество запретов по столбцам
    CandidateSet(const vector<vector<int>>& data, int kx, int ky) {
        set<int> x, y;
        build(data, x, y, kx, ky);
    }

    int build(const vector<vector<int>>& data, set<int>& x, set<int>& y, int kx, int ky) {
        int res = v.size();

        v.push_back(get_neutral_candidate());
        go.emplace_back(-1, -1);

        for (int i = 0; i < data.size(); ++i) {
            if (x.count(i)) continue;
            for (int j = 0; j < data[i].size(); ++j) {
                if (y.count(j)) continue;
                v.back() = max(v.back(), Candidate { data[i][j], i, j });
            }
        }

        if (v[res].x == -1) {
            v.pop_back();
            go.pop_back();
            return -1;
        }

        if (kx != 0) {
            x.insert(v[res].x);
            go[res].first = build(data, x, y, kx - 1, ky);
            x.erase(v[res].x);
        }

        if (ky != 0) {
            y.insert(v[res].y);
            go[res].second = build(data, x, y, kx, ky - 1);
            y.erase(v[res].y);
        }

        return res;
    }

    Candidate get_max(int x, int y) {
        auto ans = get_neutral_candidate();
        for (auto& s : v) if (s.x != x && s.y != y) ans = max(ans, s);
        return ans;
    }

    Candidate get_max(const set<int>& x, const set<int>& y) {
        auto ans = get_neutral_candidate();
        for (auto& s : v) if (!x.count(s.x) && !y.count(s.y)) ans = max(ans, s);
        return ans;
    }
};

Чтобы в таком случае искать максимум можно просто пройтись по кандидатам $$$O(K^2)$$$ или используя дерево рекурсивных вызовов пройтись по нему и найти максимум за $$$O(K)$$$, во всяком случае, вы понимаете, что это работает быстро. Да, кстати, по очевидным причинам алгоритм построения этой таблицы работает за $$$O((NK)^2)$$$, и алгоритм является корректным. Почему? Ну потому что если вдруг глобальный максимум не будет запрещен по обоим кандидатам, то очевидно, это будет ответ на запрос, а в ином случае, если запрещена строка, в которой он находится, то в одном из рекурсивных вызовов мы посчитали другого кандидата и так далее.

Почему это бывает полезно?

Приведу пример задачи на эту тему. У нас есть дерево размером $$$N$$$, в каждой вершине которого записана буква от $$$a$$$ до $$$z$$$, назовем строку хорошей, если ни одна его подстрока длиной больше $$$1$$$ не является палиндромом. Требуется найти максимальную подпоследовательность, какого-то простого пути в дереве, такую, что если записать символы в вершинах этой последовательности, то получится хорошая строка.

Докинем в афлавит фиктивный символ $$$\epsilon$$$. За $$$\Sigma$$$ обозначим размер алфавита, в данном случае $$$\Sigma = 26 + 1$$$. Заведем трехмерную динамику $$$dp$$$ с размерностью $$$N \times \Sigma \times \Sigma$$$, в $$$dp[v][i][j]$$$ будем хранить максимальную подпоследовательность, пути идущего сверху-вниз до вершины $$$v$$$, два последних символа которой равны $$$i$$$ и $$$j$$$, $$$i=j=\epsilon$$$ значит, что строка пустая, $$$i=\epsilon$$$ значит, что строка содержит ровно один символ. Динамика очень легко пересчитывается и это суммарно отработает за $$$O(N \cdot \Sigma ^ 2)$$$. Чтобы посчитать ответ на задачу требуется перебрать LCA двух конечных вершин пути и с помощью посчитанных значений динамики найти максимальное значение $$$dp'[u][x][y] + dp[v][z][w]$$$, где $$$dp'[u]$$$ обозначает динамику $$$dp$$$, посчитанную для путей исходящих из поддерева вершины $$$u$$$ и заканчивающих свой путь в предке $$$u$$$, при этом $$$u$$$ и $$$v$$$ -- братья и при этом $$$y \neq z$$$, $$$y \neq w$$$, $$$x \neq z$$$. При этом такой максимум уже можно найти за $$$O(N{\Sigma}^4)$$$, это медленно.. Можно постараться и найти его за $$$O(N{\Sigma}^3)$$$. Но с помощью структуры данных, описанных выше это можно сделать тривиальным образом за $$$O(N{\Sigma}^2)$$$.

Кстати, с помощью нашей структуры данных можно пойти гораздо дальше. Можно сказать, что все состояния динамики нам совершенно не нужны. Давайте вместо трехмерной динамики $$$dp$$$ построим динамику $$$dc$$$ размера $$$N$$$, основанную на CandidateSet, в котором есть не более одного запрета $$$x$$$ и не более двух запретов на $$$y$$$, для каждого состояния исходной динамики. Пересчитывать ее очень просто и приятно -- это работает за $$$O(N)$$$, единственная вещь, которую я не описал -- это объединение множества кандидатов и его обрезание, но я верю в то, что вы и сами справитесь :D. Утверждается, что глобальный максимум по $$$dp'[u][x][y] + dp[v][z][w]$$$ достигается и среди сумм $$$dc'[u][x][y] + dc[v][x][y]$$$, определенных по такому же принципу. Доказать это очень просто, пусть это останется как упражнение читателю, но с помощью этого простого трюка наше решение превращается в гордый $$$O(N)$$$ с большой константой. Ура!

пруф

Rev.	Кто	Когда	Δ	Комментарий
ru5	teraqqq	2021-11-05 20:58:53	25
ru4	teraqqq	2021-11-05 16:15:20	2	(опубликовано)
ru3	teraqqq	2021-11-05 16:15:02	551	Мелкая правка: ''$ и $w'$.\n</spoile' -> ''$ и $w'$. Это\n</spoile'
ru2	teraqqq	2021-11-05 16:02:45	1
ru1	teraqqq	2021-11-05 16:00:07	6732	Первая редакция (сохранено в черновиках)

Постановка задачи

Почему это бывает полезно?

История