Добрый день.
Теперь для поиска по постам вам вовсе не обязательно уходить в Google, а можно это делать прямо на Codeforces. Мы поддержали поиск по текстам постов на базе Apache Lucene. В индексе содержатся все открытые публичные посты, которых уже более 15000 штук.
Временно поиск по тегам теперь недоступен (но и по тегам заиндексируем), но вместо него вы обнаружите возможность найти посты и даже отсортировать выдачу по нужному критерию. Кстати, язык запросов к поисковику — это все возможности Lucene, так что можете найти полное описание и писать неочевидные запросы.
Можно ввести несколько слов — все они попадут в требования к поиску (что-то из требований может быть опущено движком, если документов, удовлетворяющих всему запросу нет). Кроме того, осуществляется поиск по словоформам и, если повезет, по синонимам. Поддерживается поиск по названию, автору и специальный синтаксис запросов.
Вот примеры запросов:
305
— ищет все посты, содержащие 305, найдет посты про Раунд 305andrew stankevich contests
— можно писать сразу много слов, будут искаться всеuser:mikemirzayanov title:сазанка
— ищет все посты в названии со словом "сазанка" авторства MikeMirzayanov"vk cup"
— можно использовать кавычку, чтобы искать точные совпаденияtitle:educational
— искать в названии
По поводу индексирования комментариев, исходных текстов решений и тестов условий есть ощущение, что это может оказаться бесполезным. Слишком сложно будет найти что-то релевантное (а может и нет). Как вы думаете, стоит делать?
Намного лучше. Тем более, что в тегах у многих была написана какая-нибудь откровенная фигня, типа #никто_не_читает_теги . Найти нужный пост или блог было очень сложно. Теперь намного легче. Спасибо, CF!
ЗЫ: хоть большинство комментариев действительно вода, есть среди них и достаточно интересные. Например, комментарии Скиданова. Почему бы не ввести? В мусоре, который выплывает в поисковике гугла, копаться многие привыкли, особых сложностей никому не составит.
Комментарии и условия точно надо индексировать. Я достаточно много раз искал фразы из комментариев.
То есть ты их как-то наизусть помнил и потом по ним искал?
Ну например "Тарас Мисюра" поищите
Hello MikeMirzayanov, I think one of the best things we could implement is a tag that should be added to all educational posts (or some other feature for storing educational posts, like with HackerEarth's Notes). Something like the CodeForces Library, if you will. The problem with searching directly for "tutorial" is that some people tag round editorials with tutorial and some people tag educational posts as "editorials". It would be really helpful to be able to know which ones have instructional content on their own as opposed to containing solutions for a round.
Thanks!
Кажется, есть проблемы с техом
Ну это почти фича. Дело в том, что посты хочется где-то обрывать, а просто так в произвольном месте разметку плохо рвать — что-нибудь да поедет. Кроме того иногда интересные слова находятся именно в элементах разметки, например, урлах — их приятно видеть в этой выдаче. Еще будут реально мешаться всякие картинки в постах.
Indexing problem statements would be a good idea.
Could you please make code of some of these codeforces features open source, so that we can learn from them?
Lucene is already open source.
hmmm
Statements should be reasonable to find in a lot of situations (you remember something of the story, the name of the character, etc) and would be pretty useful as well
Ну вот по тем же новым Educational раундам точно видно, что надо индексировать условия.
Bug report
Sure http://codeforces.net/blog/entry/22251?locale=ru#comment-268314 ?
How can I view all codeforces blogs?? I think that there should be an option or a link for this..