Разработчики должны представить алгоритм, который сможет отличать тексты на русском и английском языках от текстов на других языках; отделять новости от других текстов; группировать новости по семи категориям: «Общество», «Экономика», «Технологии», «Развлечения», «Наука», «Спорт» и «Другие». Также алгоритм должен будет группировать похожие новости в сюжеты и ранжировать их.
На создание алгоритма желающим принять участие в конкурсе выделили две недели. Свои разработки участники Data Clustering Contest должны загрузить на @jobs_bot до 22:50 мск 2 декабря.
Авторы лучших работ разделят призовой фонд в размере $100 тыс. и смогут поучаствовать во втором этапе конкурса, где получат шанс претендовать еще на $100 тыс.
Создание нового новостного агрегатора основатель Telegram Павел Дуров анонсировал в июне 2019 года. Для работы над новым агрегатором Дуров рассчитывал привлечь разработчиков, работающих над «Яндекс.Новостями» и другими сервисами рекомендаций контента.