Блог пользователя 30iq

Автор 30iq, история, 6 лет назад, По-русски

Всем привет. Столкнулся с задачей :
Дан массив чисел длины n, 1 <= a[i] <= n, поступают запросы двух видов.
1) l r X Y ( 1 ≤ l ≤ r ≤ n , 1 ≤ X , Y ≤ n ) всем i, l <= i <= r, если arr[i] == X, то установить в arr[i] значение Y.
2) l r найти K-й порядковый элемент на отрезке с l по r.
n <= 10^5.
Хотел решить сам, но никак не выходит. Уже несколько дней не могу нормально спать)), помогите с решением, пожалуйста. Заранее спасибо.

  • Проголосовать: нравится
  • +11
  • Проголосовать: не нравится

»
6 лет назад, # |
  Проголосовать: нравится +2 Проголосовать: не нравится

"Уже несколько дней не могу нормально спать))" — Плохо)

Ок, попробую написать решение, которое скорее всего должно пройти по времени:

Решение с использованием SQRT-декомпозиции по блокам

  1. Разбить массив на блоки длины K ~ sqrt(N)
  2. Для каждого блока хранить частичные блоки(отсортиванный список элементов и их позиции), кроме того Sum1 — сколько чисел меньше K, 2K, 3K, ... N, и ещё внутри каждого частичного блока ещё блоки, то есть Sum1[i] — сколько чисел меньше либо равно i*K, Sum2[i][j] — обозначает сколько чисел меньше либо равно i*K + j, пересчитываем Фенвиком.
  3. Апдейт не сложно сделать за какое-нибудь время O(K log N + (N/K) log N) для Sum1 и для Sum2 в каждом блоке и для элементов которые не входят в блоки целиком — [L..(L+K-1)*K), [R/K*K..R], могу расписать подробнее
  4. Запрос К-го порядкого элемента тоже не сложно, просто бинпоиск по Sum1: находим блок где должен быть K-ый элемент по Sum1, потом бинпоиск по Sum2. Но вместо бинпоиска можно сделать внешний спуск по дереву Фенвика для нескольких блоков, и нужно учитывать элементы которые не входят в блоки [L..(L+K-1)*K), [R/K*K..R]. Получается O(K log N + (N/K) log N)

Естественно, можно хранить только один Фенвик Sum[i](сколько чисел меньше либо равно i) для всего блока, но тогда прыжки по памяти будут больше(зависит от тестов и компилятора!).

  • »
    »
    6 лет назад, # ^ |
      Проголосовать: нравится -10 Проголосовать: не нравится

    "Естественно, можно хранить только один Фенвик Sum[i](сколько чисел меньше либо равно i) для всего блока"
    правильно ли я понял, что можно для каждого блока хранить дерево Фенвика длины n? Тогда как отвечать на запросы внутри одного блока?

    • »
      »
      »
      6 лет назад, # ^ |
      Rev. 4   Проголосовать: нравится -10 Проголосовать: не нравится

      Для каждого блока, помимо Фенвика/корневой нужно держать ещё массив next[block][i](*first, *last) (это пара, указатель на первый элемент в блоке который равен i и последний элемент в блоке, который равен i(порядок не важен), либо {NULL, NULL}, если нет чисел равных i).

      Теперь, когда нужно сделать операцию X -> Y, смотрим если next[Block][X] не пустой, то коннектим их в один список: next[Block][X]->last -> next[Block][Y]->first, next[Block][Y]->first = next[Block][X]->first, next[Block][X]->first = next[Block][X]->second = NULL: O(1)

      Для восстановления блока просто пробежим по всем возможным значениям (не более sqrt(N)) и проитерируемся по спискам элементов в них (мы знаем указатели на них) те значения, суммарно O(sqrt(N))

      С учётом первой идеи ниже можно достичь решения со сложностью O(N sqrt(N))

      • »
        »
        »
        »
        6 лет назад, # ^ |
        Rev. 4   Проголосовать: нравится +4 Проголосовать: не нравится

        Пусть над блоком были операции:

        Тогда все элементы равные 1 должны быть равны 2, а элементы равные 3 должны быть равны 4, у тебя же будет записано next[block][1] = 4, next[block][3] = 1, что неверно.

        На самом деле, в этой задаче не заходит и нужно думать о более быстром решении.

        Решим задачу, если мы магическим образом умеем понимать какое число стоит на позиции i после применения всех запросов.

        Давайте на каждом префиксе кратном насчитаем количество каждого числа (мы на это потратим времени и памяти). Теперь в каждом таком префиксе все числа разобьем на блоки по корню и будем в каждом блоке помнить сумму.

        Тогда отвечать на запрос просто — нам надо взять разность двух префиксов и учесть эелементы с краев, поскольку у нас числа разбиты на блоки по корню, мы за корень находим нужный блок, а затем в нужном блоке ещё раз за корень находим нужное число, учёт элементов с краев тоже за корень.

        Такие махинации с «корневой в корневой» были сделаны ради быстрого изменения, ибо теперь мы каждый блок обновляем за O(1), а, следовательно, изменение основной структуры у нас тоже за корень.

        Единственная проблема — восстановление реальных чисел в конкретных позициях для случаев, когда концы запроса не кратны корню. Для этого разобъем массив на блоки по корню и будем в каждом хранить DSU. К сожалению в DSU нельзя просто так делать merge компонент и хранить реальное значение в компоненте. В качестве контртеста можно предъявить тест из начала комментария. Чтобы избежать этой проблемы, будем хранить dsu размера n. А так же для каждого числа будем хранить, встречается ли оно хоть раз в блоке.

        Когда нам пришёл запрос о переводе отсутствующего на отрезке числа, пропускаем этот запрос, иначе смотрим, если ли на отрезке число, в которое мы переводим. Если есть, просто делаем merge, иначе создаём «новую вершину» (с номером ), запоминаем что эта вершина отвечает за число Y, и делаем merge. Не забываем в каждой компоненте хранить реальное значение всех чисел из нее.

        Итоговая асимптотика

        • »
          »
          »
          »
          »
          6 лет назад, # ^ |
          Rev. 3   Проголосовать: нравится 0 Проголосовать: не нравится

          Спасибо за решение!

          Да, восстановление чисел не так тривально.

        • »
          »
          »
          »
          »
          6 лет назад, # ^ |
            Проголосовать: нравится 0 Проголосовать: не нравится

          Почему merge в dsu не за O(log)? Мы же соединяем деревья не меньшее к большему, а так как велят запросы

          • »
            »
            »
            »
            »
            »
            6 лет назад, # ^ |
              Проголосовать: нравится +1 Проголосовать: не нравится

            Никто не мешает делать merge меньшего к большему, просто после merge надо не забыть сделать что-то вида:

            • »
              »
              »
              »
              »
              »
              »
              6 лет назад, # ^ |
              Rev. 2   Проголосовать: нравится 0 Проголосовать: не нравится

              Это гениально!///. Но смогу ли я уместить все это в 512 МБ?

              • »
                »
                »
                »
                »
                »
                »
                »
                6 лет назад, # ^ |
                Rev. 5   Проголосовать: нравится +1 Проголосовать: не нравится

                Размер блока не обязательно делать ровно , можно его немного двигать, чтобы влезло по памяти.

                Например можно выбрать 512, тогда еще операции деления будут соптимизированы битовыми сдвигами.

                Также, немного усложнив код, можно сделать массивы для DSU размера , а не .

                Теперь по памяти, каждый массив будет иметь размер примерно .

                В итоге в коде тебе нужно всего 5 массивов такого размера (на каждый префикс, предки в DSU, ранги в DSU, real_value, where_value), это всего 108 4 байтных чисел (а вообще ранги можно хранить в char, так что еще меньше), что будет занимать примерно 382 МБ.

                Если ты говоришь про эту задачу, то c блоком размера 512 там заходит за секунду примерно.

                • »
                  »
                  »
                  »
                  »
                  »
                  »
                  »
                  »
                  6 лет назад, # ^ |
                    Проголосовать: нравится 0 Проголосовать: не нравится

                  Огромное спасибо, структура DSU двойного размера просто нечто!!

                • »
                  »
                  »
                  »
                  »
                  »
                  »
                  »
                  »
                  6 лет назад, # ^ |
                  Rev. 2   Проголосовать: нравится -9 Проголосовать: не нравится

                  deleted

                • »
                  »
                  »
                  »
                  »
                  »
                  »
                  »
                  »
                  6 лет назад, # ^ |
                  Rev. 2   Проголосовать: нравится +1 Проголосовать: не нравится

                  ch_egor А можете пересдать на информатиксе эту задачу? Там сервер обновили, он стал в 2.5 раза медленнее (по крайней мере ejudge-vm-64). Предположительно, Ваше решение теперь не уложится в TL, но могу ошибаться

»
6 лет назад, # |
  Проголосовать: нравится -16 Проголосовать: не нравится

Можно сделать за O(log^2n) на запрос. Создадим дерево отрезков, а в каждой его вершине — декартово дерево. Будем поддерживать в ДД пару (число, кол-во). Тогда для обработки 1 запроса достаточно спуститься в нужную вершину ДО (которая соответствует отрезку [l;r]), в текущем ДД удалить число X и вставить пару (Y, кол-во удаленных X) (либо если существует, просто добавить это кол-во). Ну я думаю запрос 2 типа тривиален.

  • »
    »
    6 лет назад, # ^ |
    Rev. 4   Проголосовать: нравится +1 Проголосовать: не нравится

    "Ну я думаю запрос 2 типа тривиален."
    Нет, в этом главная проблема). Ну то есть, ты разбил отрезок [l, r) на отрезков (это дерево отрезков), на каждом отрезке ты умеешь считать порядковую статистику за . Как тебе это поможет посчитать порядковую статистику на отрезке [l, r) за — непонятно, скорее всего никак. Может, можно получить (но это будет оооооочень грустный (с большой константой)).

    Сама по себе задача о k-ой порядковой статистике на отрезке посложнее, чем просто дерево отрезков декартовых. https://codeforces.net/blog/entry/2954?locale=ru

    • »
      »
      »
      6 лет назад, # ^ |
        Проголосовать: нравится +1 Проголосовать: не нравится

      С первой частью тоже есть проблема, не понятно как делать push при такой операции.

  • »
    »
    6 лет назад, # ^ |
      Проголосовать: нравится +12 Проголосовать: не нравится

    Написал ерунду, не читайте)

»
6 лет назад, # |
  Проголосовать: нравится -9 Проголосовать: не нравится

Вроде я придумал как решать за на запрос.
Давайте вспомним решение за без изменений: отсортируем все пары { a[i], i } по неубыванию, получим отсортированный массив, и по второму элементу в паре(то есть по индексам i) построим MegeSortTree(дерево отрезков, в вершине которого расположен отсортированный массив отрезка, за который отвечает данная вершина). Теперь для запроса k-того элемента нам нужно уметь спускаться по ДО и понимать, в каком сыне лежит ответ. Как это сделать? Если в левом сыне есть хотя бы k чисел из отрезка от l до r, то переходив в него, иначе — в правого новым k, равным разности старого k и количеству чисел от l до r в левом сыне.
Ок, я утверждаю, что мы можем переделать нашу структуру так, чтобы мы могли ее изменять. Для этого потребуется быстро перестраивать наш отсортированный массив пар, и, соответственно, ДО, которое мы построили по нему. Для этого Заменим ДО на ДД по неявному ключу, а в вершине ДД будем хранить еще одно ДД, но уже по ключу, чтобы быстро перестраивать сортированный массив, как в ДО. Итого мы не ухудшили асимптотику, но смогли в изменения.

  • »
    »
    6 лет назад, # ^ |
      Проголосовать: нравится +1 Проголосовать: не нравится

    Если в левом сыне есть хотя бы k чисел из отрезка от l до r

    И как это проверять с ДД?

»
6 лет назад, # |
Rev. 2   Проголосовать: нравится +11 Проголосовать: не нравится

Если кому-то будет полезно (вряд ли), сдал решение за O(n * m / 8 + m * sqrt(n)), то есть, запросы модицикации за квадрат, а один запрос порядковой статистики за корень. Там есть вызов функции stressTest() в начале main, его можно опустить. Может у кого-нибудь получится заставить GCC применить авто-векторизацию в месте, где срезается константа (строки 114-123).

Мне не удалось

Кстати, TL на информатиксе к этой задаче был увеличен в два раза.

  • »
    »
    6 лет назад, # ^ |
      Проголосовать: нравится 0 Проголосовать: не нравится

    Может у кого-нибудь получится заставить GCC применить авто-векторизацию в месте, где срезается константа (строки 114-123).

    Как-то так. Правда работает чуть медленнее.

    • »
      »
      »
      6 лет назад, # ^ |
        Проголосовать: нравится 0 Проголосовать: не нравится

      Спасибо. Не думал, что прямо такой цикл сильно не просядет, да еще и с интами. Глянул в ассемблер: gcc заюзал 128-битные регистры + не развернул цикл по несколько итераций. Видимо производительность упирается только в скорость доступа к данным?