K-й порядковый элемент на отрезке

→ Обратите внимание

До соревнования
CodeTON Round 9 (Div. 1 + Div. 2, Rated, Prizes!)
17:17:33
Зарегистрироваться »

*есть доп. регистрация

→ Трансляции

Leetcode BiWeekly Contest 144 — Solution Discussion

Shayan

До начала 18:47:33

Codeforces CodeTON Round 9 (Div 1 + Div 2) — Solution Discussion

Shayan

До начала 20:17:33

Всё →

→ Лидеры (рейтинг)

№	Пользователь	Рейтинг
1	tourist	4009
2	jiangly	3823
3	Benq	3738
4	Radewoosh	3633
5	jqdai0815	3620
6	orzdevinwang	3529
7	ecnerwala	3446
8	Um_nik	3396
9	ksun48	3390
10	gamegame	3386

Страны | Города | Организации

Всё →

→ Лидеры (вклад)

№	Пользователь	Вклад
1	cry	167
2	Um_nik	163
3	maomao90	162
3	atcoder_official	162
5	adamant	159
6	-is-this-fft-	158
7	awoo	157
8	TheScrasse	154
9	Dominater069	153
9	nor	153

Всё →

→ Найти пользователя

→ Прямой эфир

Детальнее →

Блог пользователя 30iq

K-й порядковый элемент на отрезке

Автор 30iq, история, 6 лет назад, По-русски

Всем привет. Столкнулся с задачей :
Дан массив чисел длины n, 1 <= a[i] <= n, поступают запросы двух видов.
1) l r X Y ( 1 ≤ l ≤ r ≤ n , 1 ≤ X , Y ≤ n ) всем i, l <= i <= r, если arr[i] == X, то установить в arr[i] значение Y.
2) l r найти K-й порядковый элемент на отрезке с l по r.
n <= 10^5.
Хотел решить сам, но никак не выходит. Уже несколько дней не могу нормально спать)), помогите с решением, пожалуйста. Заранее спасибо.

структруры данных, нужна помощь

30iq
6 лет назад
21

Комментарии (21)

Написать комментарий?

mgch

6 лет назад, # |

"Уже несколько дней не могу нормально спать))" — Плохо)

Ок, попробую написать решение, которое скорее всего должно пройти по времени:

Решение с использованием SQRT-декомпозиции по блокам

Разбить массив на блоки длины K ~ sqrt(N)
Для каждого блока хранить частичные блоки(отсортиванный список элементов и их позиции), кроме того Sum1 — сколько чисел меньше K, 2K, 3K, ... N, и ещё внутри каждого частичного блока ещё блоки, то есть Sum1[i] — сколько чисел меньше либо равно i*K, Sum2[i][j] — обозначает сколько чисел меньше либо равно i*K + j, пересчитываем Фенвиком.
Апдейт не сложно сделать за какое-нибудь время O(K log N + (N/K) log N) для Sum1 и для Sum2 в каждом блоке и для элементов которые не входят в блоки целиком — [L..(L+K-1)*K), [R/K*K..R], могу расписать подробнее
Запрос К-го порядкого элемента тоже не сложно, просто бинпоиск по Sum1: находим блок где должен быть K-ый элемент по Sum1, потом бинпоиск по Sum2. Но вместо бинпоиска можно сделать внешний спуск по дереву Фенвика для нескольких блоков, и нужно учитывать элементы которые не входят в блоки [L..(L+K-1)*K), [R/K*K..R]. Получается O(K log N + (N/K) log N)

Естественно, можно хранить только один Фенвик Sum[i](сколько чисел меньше либо равно i) для всего блока, но тогда прыжки по памяти будут больше(зависит от тестов и компилятора!).

→ Ответить

30iq

6 лет назад, # ^ |

-10

"Естественно, можно хранить только один Фенвик Sum[i](сколько чисел меньше либо равно i) для всего блока"
правильно ли я понял, что можно для каждого блока хранить дерево Фенвика длины n? Тогда как отвечать на запросы внутри одного блока?

→ Ответить

mgch

6 лет назад, # ^ |

← Rev. 4 →

-10

Для каждого блока, помимо Фенвика/корневой нужно держать ещё массив next[block][i](*first, *last) (это пара, указатель на первый элемент в блоке который равен i и последний элемент в блоке, который равен i(порядок не важен), либо {NULL, NULL}, если нет чисел равных i).

Теперь, когда нужно сделать операцию X -> Y, смотрим если next[Block][X] не пустой, то коннектим их в один список: next[Block][X]->last -> next[Block][Y]->first, next[Block][Y]->first = next[Block][X]->first, next[Block][X]->first = next[Block][X]->second = NULL: O(1)

Для восстановления блока просто пробежим по всем возможным значениям (не более sqrt(N)) и проитерируемся по спискам элементов в них (мы знаем указатели на них) те значения, суммарно O(sqrt(N))

С учётом первой идеи ниже можно достичь решения со сложностью O(N sqrt(N))

→ Ответить

ch_egor

6 лет назад, # ^ |

← Rev. 4 →

Пусть над блоком были операции:

$\text{[math]}$

Тогда все элементы равные 1 должны быть равны 2, а элементы равные 3 должны быть равны 4, у тебя же будет записано next[block][1] = 4, next[block][3] = 1, что неверно.

На самом деле, в этой задаче не заходит $\text{[math]}$ и нужно думать о более быстром решении.

Решим задачу, если мы магическим образом умеем понимать какое число стоит на позиции i после применения всех запросов.

Давайте на каждом префиксе кратном $\text{[math]}$ насчитаем количество каждого числа (мы на это потратим $\text{[math]}$ времени и памяти). Теперь в каждом таком префиксе все числа разобьем на блоки по корню и будем в каждом блоке помнить сумму.

Тогда отвечать на запрос просто — нам надо взять разность двух префиксов и учесть эелементы с краев, поскольку у нас числа разбиты на блоки по корню, мы за корень находим нужный блок, а затем в нужном блоке ещё раз за корень находим нужное число, учёт элементов с краев тоже за корень.

Такие махинации с «корневой в корневой» были сделаны ради быстрого изменения, ибо теперь мы каждый блок обновляем за O(1), а, следовательно, изменение основной структуры у нас тоже за корень.

Единственная проблема — восстановление реальных чисел в конкретных позициях для случаев, когда концы запроса не кратны корню. Для этого разобъем массив на блоки по корню и будем в каждом хранить DSU. К сожалению в DSU нельзя просто так делать merge компонент и хранить реальное значение в компоненте. В качестве контртеста можно предъявить тест из начала комментария. Чтобы избежать этой проблемы, будем хранить dsu размера 2·n. А так же для каждого числа будем хранить, встречается ли оно хоть раз в блоке.

Когда нам пришёл запрос о переводе отсутствующего на отрезке числа, пропускаем этот запрос, иначе смотрим, если ли на отрезке число, в которое мы переводим. Если есть, просто делаем merge, иначе создаём «новую вершину» (с номером $\text{[math]}$ ), запоминаем что эта вершина отвечает за число Y, и делаем merge. Не забываем в каждой компоненте хранить реальное значение всех чисел из нее.

Итоговая асимптотика $\text{[math]}$

→ Ответить

mgch

6 лет назад, # ^ |

← Rev. 3 →

Спасибо за решение!

Да, восстановление чисел не так тривально.

→ Ответить

30iq

6 лет назад, # ^ |

Почему merge в dsu не за O(log)? Мы же соединяем деревья не меньшее к большему, а так как велят запросы

→ Ответить

ch_egor

6 лет назад, # ^ |

Никто не мешает делать merge меньшего к большему, просто после merge надо не забыть сделать что-то вида:

$\text{[math]}$

→ Ответить

30iq

6 лет назад, # ^ |

← Rev. 2 →

Это гениально!///. Но смогу ли я уместить все это в 512 МБ?

→ Ответить

ch_egor

6 лет назад, # ^ |

← Rev. 5 →

Размер блока не обязательно делать ровно $\text{[math]}$ , можно его немного двигать, чтобы влезло по памяти.

Например можно выбрать 512, тогда еще операции деления будут соптимизированы битовыми сдвигами.

Также, немного усложнив код, можно сделать массивы для DSU размера $\text{[math]}$ , а не $\text{[math]}$ .

Теперь по памяти, каждый массив будет иметь размер примерно $\text{[math]}$ .

В итоге в коде тебе нужно всего 5 массивов такого размера (на каждый префикс, предки в DSU, ранги в DSU, real_value, where_value), это всего 10⁸ 4 байтных чисел (а вообще ранги можно хранить в char, так что еще меньше), что будет занимать примерно 382 МБ.

Если ты говоришь про эту задачу, то c блоком размера 512 там заходит за секунду примерно.

→ Ответить

30iq

6 лет назад, # ^ |

Огромное спасибо, структура DSU двойного размера просто нечто!!

→ Ответить

Avtakhov

6 лет назад, # ^ |

← Rev. 2 →

-9

deleted

→ Ответить

dmkz

6 лет назад, # ^ |

← Rev. 2 →

ch_egor А можете пересдать на информатиксе эту задачу? Там сервер обновили, он стал в 2.5 раза медленнее (по крайней мере ejudge-vm-64). Предположительно, Ваше решение теперь не уложится в TL, но могу ошибаться

→ Ответить

Dword

6 лет назад, # |

-16

Можно сделать за O(log^2n) на запрос. Создадим дерево отрезков, а в каждой его вершине — декартово дерево. Будем поддерживать в ДД пару (число, кол-во). Тогда для обработки 1 запроса достаточно спуститься в нужную вершину ДО (которая соответствует отрезку [l;r]), в текущем ДД удалить число X и вставить пару (Y, кол-во удаленных X) (либо если существует, просто добавить это кол-во). Ну я думаю запрос 2 типа тривиален.

→ Ответить

Ralsei

6 лет назад, # ^ |

← Rev. 4 →

"Ну я думаю запрос 2 типа тривиален."
Нет, в этом главная проблема). Ну то есть, ты разбил отрезок [l, r) на $\text{[math]}$ отрезков $\text{[math]}$ (это дерево отрезков), на каждом отрезке ты умеешь считать порядковую статистику за $\text{[math]}$ . Как тебе это поможет посчитать порядковую статистику на отрезке [l, r) за $\text{[math]}$ — непонятно, скорее всего никак. Может, можно получить $\text{[math]}$ (но это будет оооооочень грустный $\text{[math]}$ (с большой константой)).

Сама по себе задача о k-ой порядковой статистике на отрезке посложнее, чем просто дерево отрезков декартовых. https://codeforces.net/blog/entry/2954?locale=ru

→ Ответить

ch_egor

6 лет назад, # ^ |

С первой частью тоже есть проблема, не понятно как делать push при такой операции.

→ Ответить

Dword

6 лет назад, # ^ |

+12

Написал ерунду, не читайте)

→ Ответить

I_love_myself

6 лет назад, # |

-9

Вроде я придумал как решать за $\text{[math]}$ на запрос.
Давайте вспомним решение за $\text{[math]}$ без изменений: отсортируем все пары { a[i], i } по неубыванию, получим отсортированный массив, и по второму элементу в паре(то есть по индексам i) построим MegeSortTree(дерево отрезков, в вершине которого расположен отсортированный массив отрезка, за который отвечает данная вершина). Теперь для запроса k-того элемента нам нужно уметь спускаться по ДО и понимать, в каком сыне лежит ответ. Как это сделать? Если в левом сыне есть хотя бы k чисел из отрезка от l до r, то переходив в него, иначе — в правого новым k, равным разности старого k и количеству чисел от l до r в левом сыне.
Ок, я утверждаю, что мы можем переделать нашу структуру так, чтобы мы могли ее изменять. Для этого потребуется быстро перестраивать наш отсортированный массив пар, и, соответственно, ДО, которое мы построили по нему. Для этого Заменим ДО на ДД по неявному ключу, а в вершине ДД будем хранить еще одно ДД, но уже по ключу, чтобы быстро перестраивать сортированный массив, как в ДО. Итого мы не ухудшили асимптотику, но смогли в изменения.

→ Ответить

MrDindows

6 лет назад, # ^ |

Если в левом сыне есть хотя бы k чисел из отрезка от l до r

И как это проверять с ДД?

→ Ответить

dmkz

6 лет назад, # |

← Rev. 2 →

+11

Если кому-то будет полезно (вряд ли), сдал решение за O(n * m / 8 + m * sqrt(n)), то есть, запросы модицикации за квадрат, а один запрос порядковой статистики за корень. Там есть вызов функции stressTest() в начале main, его можно опустить. Может у кого-нибудь получится заставить GCC применить авто-векторизацию в месте, где срезается константа (строки 114-123).

Мне не удалось

for (int i = 0; i + 31 < blockSize; i += 32) {
    uint32_t bitmask = 0;
    for (int j = 0; j < 32; j += 8) {
        __m256 va = _mm256_load_ps(blockBegin + i + j);
        __m256 rs = _mm256_cmp_ps(vx, va, _CMP_EQ_OQ);
        bitmask = (bitmask << 8) | _mm256_movemask_ps(rs);
        _mm256_maskstore_ps(blockBegin + i + j, _mm256_cvtps_epi32(rs), vy);
    }
    changes += __builtin_popcountll(bitmask);
}

Кстати, TL на информатиксе к этой задаче был увеличен в два раза.

→ Ответить

MrDindows

6 лет назад, # ^ |

Может у кого-нибудь получится заставить GCC применить авто-векторизацию в месте, где срезается константа (строки 114-123).

Как-то так. Правда работает чуть медленнее.

→ Ответить

dmkz

6 лет назад, # ^ |

Спасибо. Не думал, что прямо такой цикл сильно не просядет, да еще и с интами. Глянул в ассемблер: gcc заюзал 128-битные регистры + не развернул цикл по несколько итераций. Видимо производительность упирается только в скорость доступа к данным?

→ Ответить

Соревнования по программированию 2.0

Время на сервере: 23.11.2024 00:17:27 (i1).

Десктопная версия, переключиться на мобильную.

При поддержке