Abbyy Cup 2.0 - Финал (неоф. трансляция) |
---|
Закончено |
Умный Бобер из ABBYY в очередной раз порадовал участников ABBYY Cup'а своей задачей! В этот раз Бобер предлагает участникам соревнований попробовать себя в задаче классификации документов по темам. Итак, опишем суть задачи:
Вам дается некоторая обучающая выборка документов. Для каждого из этих документов известна его тема. В данной задаче тема — это некоторое целое число от 1 до 3. Каждое из этих чисел имеет физический смысл. Например, тексты темы 3 посвящены торговле.
Скачать обучающую выборку текстов можно по следующей ссылке: http://download4.abbyy.com/a2/X2RZ2ZWXBG5VYWAL61H76ZQM/train.zip. Внутри находятся три каталога с именами «1», «2», «3». Каталог с именем «1» содержит документы 1-ой темы, каталог «2» содержит документы 2-ой темы, а каталог «3» содержит документы 3-ей темы. Каждый документ соответствует ровно одному файлу из некоторого каталога.
Все документы имеют следующий формат: первая строка содержит идентификатор документа, вторая строка содержит название документа, все последующие строки содержат текст документа. Идентификатор документа используется для удобства установки задачи и не несет никакой полезной информации для участников.
Вам нужно написать программу, которая должна указывать тему для некоторого произвольного документа. Гарантируется, что все предоставленные для программы документы соответствуют одной из трех тем обучающей выборки.
В первой строке содержится целое число id (0 ≤ id ≤ 106) — идентификатор документа. Во второй строке содержится название документа. В третьей и последующих строках содержится текст документа. Гарантируется, что размер любого исходного документа не превысит 10 килобайт.
Тесты для этой задачи разбиты на 10 групп. Документы групп 1 и 2 взяты из обучающей выборки, однако их идентификаторы не будут совпадать с идентификаторами, указанными в обучающей выборке. Группы с 3-ей по 10-ую, по мнению авторов, примерно отсортированы в порядке возрастания сложности (документы этих групп отсутствуют в обучающей выборке).
Выведите целое число от 1 до 3 включительно — номер темы, которой соответствует данный документ.
Название |
---|