Сжатый бор.

→ Обратите внимание

До соревнования
CodeTON Round 9 (Div. 1 + Div. 2, Rated, Prizes!)
08:48:35
Зарегистрироваться »

*есть доп. регистрация

→ Трансляции

Leetcode BiWeekly Contest 144 — Solution Discussion

Shayan

До начала 10:18:34

Codeforces CodeTON Round 9 (Div 1 + Div 2) — Solution Discussion

Shayan

До начала 11:48:34

Всё →

→ Лидеры (рейтинг)

№	Пользователь	Рейтинг
1	tourist	4009
2	jiangly	3823
3	Benq	3738
4	Radewoosh	3633
5	jqdai0815	3620
6	orzdevinwang	3529
7	ecnerwala	3446
8	Um_nik	3396
9	ksun48	3390
10	gamegame	3386

Страны | Города | Организации

Всё →

→ Лидеры (вклад)

№	Пользователь	Вклад
1	cry	167
2	Um_nik	163
3	maomao90	162
4	atcoder_official	161
5	adamant	159
6	-is-this-fft-	158
7	awoo	156
8	TheScrasse	154
9	Dominater069	153
9	nor	153

Всё →

→ Найти пользователя

→ Прямой эфир

Детальнее →

Блог пользователя Odeen

Сжатый бор.

Автор Odeen, 12 лет назад, По-русски

Расскажите, пожалуйста, суть сжатого бора и аспекты реализации.

бор

Odeen
12 лет назад
19

Комментарии (19)

Написать комментарий?

nerd

12 лет назад, # |

http://informatics.mccme.ru/moodle/mod/book/view.php?id=435&chapterid=121

→ Ответить

goo.gl_SsAhv

12 лет назад, # |

← Rev. 7 →

суть в песок. А сжатый бор это экономное по памяти представление обычного бора.
обычный бор для строк {"abcd", "abef"} содержит (вместе с корнем) 7 вершин, и выглядит как-то так:
0-a>1-b>2-c>3-d>4
.............\-e>5-f>6
на каждом ребре мы пишем одну букву
сжатый бор будет выглядеть как-то вот так:
0-ab>1-cd>2
..........\-ef>3
т.е. на каждом ребре мы можем писать несколько букв (вершина есть только если в этом месте бора есть развилка)

→ Ответить

Odeen

12 лет назад, # ^ |

Можно про реализацию по-подробнее. С обычным бором знаком.

→ Ответить

goo.gl_SsAhv

12 лет назад, # ^ |

← Rev. 2 →

Ну идешь по бору пока твой префикс совпадает с тем что написано на рёбрах, каждый момент времени у нас есть уже некоторый совавший префикс, текущая вершина соответствующая этому префиксу, и оставшаяся часть нашей добавляемой строки. Каждый раз мы берём то ребро, с которым максимально совпадает префикс оставшейся части, и здесь может быть несколько вариантов.
1) ребро, по которому нам надо идти, меньше либо равно по длине оставшейся части строки и полностью с нами совпадает по всей длине. ну перейдём по этому ребру, отрезав от начала оставшейся части, столько символов сколько в этом ребре
2) оставшаяся часть строки пуста. Ну молодец, нашёл вершину, которая соответсвует этому префиксу, радуйся
3) рёбро совпало с нами не полностью. этот пункт на пальцах, из примера бора чуть выше: есть ребро 0-abcd>1, оставшаяс часть строки что мы добавляем abcef совпало 2 символа, надо это ребро разрезать на два, создать ещё одну вершину и переставить рёбра. после всех манипуляций получаем ту же картинку что и в примере.
Ошибка на ошибке, засыпаю после обеда, ночь не спал :)

→ Ответить

Odeen

12 лет назад, # ^ |

Получается же что у нас из каждой вершины может быть больше(намного) 26 ребер?

→ Ответить

goo.gl_SsAhv

12 лет назад, # ^ |

← Rev. 2 →

-8

хз, сплю

→ Ответить

goo.gl_SsAhv

12 лет назад, # ^ |

← Rev. 2 →

-8

гоню.

→ Ответить

Tranvick

12 лет назад, # ^ |

← Rev. 2 →

Не может. Если есть переход, допустим, по ребру "ad", а мы хотим добавить ребро "abc", мы просто расщепим уже существующее ребро, оно теперь станет ребром "a", и у других вершин добавятся переходы "bc" или "d".

→ Ответить

AlexanderBolshakov

12 лет назад, # ^ |

Не "вроде бы", а не может. В остальном Вы правы.

→ Ответить

Tranvick

12 лет назад, # ^ |

← Rev. 2 →

Да, точно не может, что-то я не проснулся еще.

→ Ответить

AlexanderBolshakov

12 лет назад, # |

В качестве хорошего примера, демонстрирующего суть сжатого бора могу привести суффиксное дерево. В нем мы храним все суффиксы строки, суммарная их длина — O(|s|^2), однако за счет хранения ребер в виде ссылок на отрезки исходной строки нам требуется только O(|s|) памяти.

→ Ответить

AlexanderBolshakov

12 лет назад, # |

← Rev. 3 →

Вот быдлокодерская реализация в моем исполнении. За качество кода заранее извиняюсь — я не сишник.

UPD. Хотя, конечно, в качестве терминатора строки в боре лучше использовать не доллар, а '\0'.

→ Ответить

Odeen

12 лет назад, # ^ |

Это случайно не задача 1414 с Тимуса? С ней и связан мой вопрос:)

→ Ответить

AlexanderBolshakov

12 лет назад, # ^ |

Это просто наспех написанная реализация сжатого бора с основными функциями и демонстрацией их использования :).

→ Ответить

Tranvick

12 лет назад, # ^ |

set за 0.1 заходит там и пишется в 15 строк

→ Ответить

yarrr

12 лет назад, # |

Давно спросить хотел, а можно ли как-то на сжатом боре Корасика написать, и нет ли у кого-нибудь примера кода?

→ Ответить

AlexanderBolshakov

12 лет назад, # ^ |

Насколько я осведомлен, нельзя, т.к. вычисление переходов, особенно когда мы стоим на середине ребра и/или переходим на середину ребра, в случае сжатого бора — задача явно нетривиальная. Наглядный пример: строки "a(10^5 букв b)c(10^5 букв b)" и "(2 * 10^5 букв b)".

→ Ответить

PavelKunyavskiy

12 лет назад, # ^ |

← Rev. 2 →

Казалось бы нам нужны суффиксные ссылки и от середин ребер. Если их все посчитать — то их квадрат. А меняться, пока мы идем по ребру, они могут черти как. И как это пересчитывать абсолютно непонятно. Если конечно у нас не суффиксное дерево. Но насколько я понимаю и здесь подсчет этих ссылок и построение за линию — задачи примерно одной сложности.

UPD. Под квадратом имею ввиду суммарную длину. Я привык думать о сжатом боре, только как о суффиксном.

→ Ответить

Urbanowicz

12 лет назад, # ^ |

Смотря что имеется ввиду. Если хотите затратить только O(m) памяти, где m — количество слов в боре, то определенно нет. Если бы это было возможно, то мы могли бы реализовать КМП, который тратит O(1) памяти на препроцессинг.

Если просто хочется вместо обычного бора сделать сжатый, то алгоритму Ахо-Корасик не сильно неважно, какими структурами у вас представлен автомат. Но суффиксные ссылки все равно придется хранить полностью.

P.S. Не понимаю, о каком квадрате говорит PavelKunyavskiy.

→ Ответить

Соревнования по программированию 2.0

Время на сервере: 23.11.2024 08:46:26 (h1).

Десктопная версия, переключиться на мобильную.

При поддержке