Неасимптотическая оптимизация параллельного бинпоиска

№	Пользователь	Рейтинг
1	tourist	3985
2	jiangly	3741
3	jqdai0815	3682
4	Benq	3529
5	orzdevinwang	3526
6	ksun48	3489
7	Radewoosh	3483
8	Kevin114514	3442
9	ecnerwala	3392
9	Um_nik	3392

№	Пользователь	Вклад
1	cry	169
2	maomao90	162
2	Um_nik	162
2	atcoder_official	162
5	djm03178	158
6	-is-this-fft-	157
7	adamant	155
8	awoo	154
8	Dominater069	154
10	nor	150

Сегодня я придумал такую оптимизацию: если сейчас запрос сведён к [l, r], то можно брать за mid не (l + r) / 2, а l + (r — l) / 3, то есть треть отрезка. Тогда если ответ в этом запросе окажется в первой трети, то мы уменьшились в 3 раза, а не в 2, что очевидно лучше. Если же ответ окажется в другой части, то мы уменьшимся всего на 1/3, но тогда позже мы пройдёмся по новому mid этого запроса в той же итерации, и тогда мы сократимся ещё хотя-бы на 1/3. В таком случае останется как максимум 2/3*2/3=4/9 (даже меньше, т.к. в этом случае мы опять его сократим на этой итерации) части запроса, что меньше 1/2, то есть количество итерации сократится. Это должно достаточно часто ускорять решение. Ещё можно попробовать брать не треть, а допустим четверть, пятую или две пятых отрезка.

Комментарии (7)

Написать комментарий?

Kihihihi

22 месяца назад, # |

+36

Мне эта оптимизация помогла сдать задачу C из этого соревнования на 100 баллов: https://codeforces.net/gym/103631 Но скорее всего эта оптимизация будет значительно ускорять код, если проверка в бинарном поиске работает за быструю асимптотику или с хорошей константой. Тогда выгоднее сделать ее два раза, чем заново проходиться по запросам (у меня в этой задаче использовалось дерево Фенвика, и отрезок поиска делился на 4). Но вообще очень прикольно)

→ Ответить

bashkort

+11

Гениален

ruban

+26

Очень интересная идея. Простая программа а-ля Монте-Карло, показывает, что чем ближе пропорция деления к 0 (или к 1), тем меньше матожидание для количества шагов. И похоже, отношение матожидания с пропорцией, близкой к 0, к стандартной, с пропорцией 0.5 будет что-то около 0.80

ch_egor

← Rev. 4 →

+53

Не все так просто, подобные методы не очень хорошо сокращают ожидаемое количество check'ов.

Про это была задача на opencup в 2016 году, там надо было угадать число за $$$\log_2 (n+1) + 0.1$$$ запросов в среднем (жюри играло честно и фиксировало число до начала игры, но игра повторялась $$$10\,000$$$ за тест). Эту задачу сдало ноль команд.

У Petr есть два блога про неё:

Почему эта задача не такая простая: https://petr-mitrichev.blogspot.com/2016/04/a-doubles-week.html?m=1
Решение: https://petr-mitrichev.blogspot.com/2016/04/a-binary-week.html?m=1

+18

Все оказалось ну очень интересно. Предварительные прикидки с использованием, естественно, теории вероятностей и случайных процессов, показывают, что при уменьшении пропорции почти до нуля выигрыш (чисто с точки зрения матожидания) растет неограниченно (или я ошибаюсь??). На практике (то есть программа Монте-карло) получается константа чуть меньше 0.8. Где истина, попробую разобраться. И еще — при практическом применении этой идеи нам надо просто уменьшить длину интервала в K раз. И, естественно, нас в первую очередь будет волновать, чтобы в 99.999 процентах случаев это работало. Тут надо, очевидно, исследовать обычное, а не предельное распределение этого самого числа шагов. И тут, скорее всего, эту самую пропорцию надо брать ну никак не предельно близкую к нулю.

orz

15 месяцев назад, # |

+21

Автор, можете пояснить? Я вот прочитал текст уже три раза и ничего не могу понять. Как бинпоиску может помочь, что мы делимся не пополам?

В частности, да, $$$\frac{4}{9} < \frac{1}{2}$$$, но мы это получили не бесплатно: мы умножили длину отрезка на $$$\frac{4}{9}$$$ за две операции, а не за одну. Если бы мы сделали две операции нормального бинпоиска, умножили бы длину отрезка на $$$\frac{1}{4} < \frac{4}{9}$$$. Так в чём выгода?

lemelisk

15 месяцев назад, # ^ |

+10

Речь идет про параллельный бинпоиск. А там помимо операций проверки запросов на каждом уровне есть ещё статичная часть, никак не зависящая от числа запросов. И за счет уменьшения количества уровней мы выигрываем в суммарном времени выполнения этой части.

Блог пользователя green_gold_dog