Хабр посоветуй: как выиграть олимпиаду НТИ для школьников по профилю «Большие данные»

Habrahabr

image

Когда я сдавал экзамены в универе, я всегда садился готовиться на ближайшую к преподу парту и никогда не шел первым, а пропускал вперед 8-10 человек. Тем самым я успевал «подслушать» дополнительные вопросы и, частично, ответы на них.

И тут у меня возникла идея, как сделать подсказки по олимпиаде для тех старшеклассников, которые читают Хабр (что говорит о том, что у них действительно продвинутые мозги). Я нашел тех ребят, которые показали отличные результаты на предыдущих олимпиадах НТИ и поспрашивал их, какие дополнительные материалы могут помочь разобраться в теме лучше и дадут дополнительные преимущества на завершающем практическом этапе.

Прием заявок на олимпиаду идет до 22 октября, а там есть еще время подготовиться.

Коротко про олимпиаду НТИ

Группа студентов посмотрели на то, что у нас твориться с образованием и решили приложить усилия, чтобы это исправить. Что творится? А то, что родители многих школьников не разрешают в гараже строить беспилотник или ходить на курсы по построению спутников, «потому что надо сдавать ЕГЭ». Так вот, наши инициативные товарищи решили создать движуху, что талантливые школьники смогут получать баллы за ЕГЭ и поступать в вузы не при помощи тестов, а поработав руками и головой. И теперь у школьников есть отмазка, зачем он кошке всверлил в мозг электроды — «к олимпиаде готовлюсь».

Я считаю, что это важно и достойно. Да и к олимпиадам отношусь с уважением.

Мои отчеты, как проходила олимпиада в 2016 году

Сами организаторы олимпиады вот что пишут про требования к знаниям и умениям участников:
  • понимание основных концепций в области машинного обучения и нейросетей;
  • программирование на языках, сочетающих скорость разработки с возможностью использовать современные инструменты для работы с данными (например Python);
  • умение быстро находить решения, разбираться в них и адаптировать под свои потребности в интернете на специализированных ресурсах (stackexchange и пр.);
  • умение эффективно работать с большими данными, писать алгоритмы эффективно; умение вести тестирование, отладку;
А вот рекомендуемые «официальные материалы для подготовки»: Как происходит олимпиада по «Большим данным»:

image

Во время проведения заключительного этапа финалисты работают над выявлением заданной информации из массивы данных, для этого участникам необходимо написать свою программу, используя набор текстов для обучение. Рабочее место — стол, ноутбук, подключенный к интернету.

image

Команда работает в режиме “каждый за своим ноутбуком”, время от времени обсуждая что-то друг с другом. Для проверки заданий ведущий запускает программу команды-участницы с набором случайных текстов и оценивает результат анализа данных.

Советы «бывалых»

Анонимус1111 советует.

Чтобы затащить конкретно последний этап в «машинке», то что-то вот такое:

Но для того, чтобы понять, что мужик говорит:

Анонимус2222 советует.

Общие рекомендации:

  • начинать не с нейронных сетей, а с более простых методов
  • играть с реальными данными
  • использовать Python в Jupyter Notebook
Конкретные ресурсы: Анонимус3333 рекомендует. О нейронках.

О tensorflow.

Простой математический курс о машинном обучении с векторами, тервером и базовым алгоритмам.

Совет от меня лично. Надо всеми силами постараться дружить с проектом GoTo, потому что там есть и качественные курсы и преподаватели, которые готовы всегда отвечать на вопросы и тусить с учениками в Яндексе по выходным. Для самых хитрых есть гранты. На крайний случай, можно вступить в группу в ВК и у всех спрашивать советы.

Что бы вы посоветовали старшеклассникам, чтобы они повысили свой скилл в области Больших данных?