Как подготовиться к школьной олим­пиаде по искус­ственному интел­лекту: 6 советов
Образование
1K
Фотография — DANO в vk.com

Как подготовиться к школьной олим­пиаде по искус­ственному интел­лекту: 6 советов

2
Аватар автора

Алексей Егоров

преподает машинное обучение в МИФИ

Страница автора

Нейросети переживают бум, и разрабатывать их учатся уже в школе.

С хорошим знанием технологий можно поучаствовать в олимпиадах и в случае успеха получить университетские льготы — вплоть до права поступить без вступительных испытаний. Чтобы достичь результата, надо готовиться: нужны как предметные знания — по олимпиадной математике и информатике, так и профильные, например владение Python и статистикой. В материале разберу, где набраться профильных умений.

Все источники в статье — бесплатные, за исключением одной книги.

Совет № 1

Выберите подходящую олимпиаду

В материале я ориентируюсь на перечневые олимпиады, подробнее о них можно почитать в статье «Какими бывают школьные олимпиады». Классического Всероса по ИИ пока нет.

В перечень на 2024/25 учебный год входят пять олимпиад для начинающих ИИ-специалистов  . Став победителем или призером, можно поступить в МИФИ, МФТИ, ИТМО, ВШЭ и другие университеты без экзаменов или получить 100 баллов за ЕГЭ по информатике и иногда по математике.

Действие льгот меняется год к году и от университета к университету: изучайте правила приема каждого вуза, чтобы точно знать, какие бонусы доступны.

Все соревнования проходят в разные сроки:

Первые три состязания устроены практически одинаково: есть отборочные этапы и финал. В отборочных этапах проверяют знания математики, информатики, дают решить простую задачу машинного обучения. В финале на командном хакатоне решают и предметные задачи, и на применение машинного обучения.

Участники DANO в отборочных турах показывают предметные навыки по математике и знания алгоритмов, а в финале в командах готовят исследовательский проект, полагаясь на анализ данных и машинное обучение. Также решают «предметку», то есть предметные задачи. Данные для проекта предлагают настоящие компании.

«Юниор» потребует на первом этапе пройти отбор по тезису своего исследовательского проекта в области машинного обучения и искусственного интеллекта. В финале проект надо представить в виде постерного доклада, а также решить задачи по математике и информатике.

Совет № 2

Изучите материалы от организаторов

Оргкомитет каждого соревнования публикует методические материалы: решение задач прошлых лет, вебинары, курсы по подготовке.

Познакомьтесь с ними, чтобы лучше понять формат заданий и выявить те навыки, которых недостает на сегодня:

Совет № 3

Пройдите курсы по машинному обучению и анализу данных

Комплексные курсы обычно покрывают необходимый минимум для старта профессионального пути школьника в ИИ. Важно понимать, что они не гарантируют побед: по завершении курсов все равно нужно много трудиться для достижения результатов.

Анализ данных от Т-Образования. Онлайн-курс с видеоуроками, практическими задачами и тестами на закрепление теории. В программе — анализ данных на Python и в Excel, элементы математической статистики, визуализация, принятие решений на основе данных. Продолжительность курса — 8 недель по 4—5 часов в день. Если набрать больше 75% верных ответов при решении тестов и практических заданий, можно получить сертификат.

Академия искусственного интеллекта от Сбера. Формат — онлайн, видеоуроки с практическими заданиями и тестами. Курс разбит на шесть блоков: Python, математика для анализа данных, основы машинного обучения, композиция моделей машинного обучения, компьютерное зрение и обработка естественного языка. Обучаться можно в своем графике. Дополнительно можно послушать лекции о применении ИИ в отраслях.

Samsung ML-bootcamp. Курс охватывает основные темы классического машинного обучения: учит решать задачи по регрессии, классификации и кластеризации, а также попробовать себя в более сложных заданиях от индустрии. Регистрация не нужна.

Хендбук по машинному обучению от «Яндекса». Интерактивный учебник от Школы анализа данных. Внутри — 16 глав с теорией и 27 практических заданий. Уровень сложности высокий.

Совет № 4

Подтяните Python

Почти весь современный прикладной искусственный интеллект написан на Python, поэтому без него никуда. Вместе с тем это один из самых простых языков программирования для новичков, хотя и со своими странностями.

Что нужно знать

Область знанийКонкретные понятия
Типы данных и структуры на их основеИзменяемые и неизменяемые типы данных, списки, множества, словари. Итераторы. Массивы, многомерные массивы, ассоциативные массивы, деревья, графы
Базовые конструкции для программированияВетвления, циклы, функции
Модули для работы с данными и их функции• Pandas для работы с данными
• NumPy для работы с массивами
• matplotlib и seaborn для визуализации данных
• sklearn для обучения классических моделей
• pytorch для глубокого обучения

Что нужно знать

Область знанийКонкретные понятия
Типы данных и структуры на их основеИзменяемые и неизменяемые типы данных, списки, множества, словари. Итераторы. Массивы, многомерные массивы, ассоциативные массивы, деревья, графы
Базовые конструкции для программи­рованияВетвления, циклы, функции
Модули для работы с данными и их функции• Pandas для работы с данными
• NumPy для работы с массивами
• matplotlib и seaborn для визуализации данных
• sklearn для обучения классических моделей
• pytorch для глубокого обучения

Хендбук по основам Python от «Яндекса». Отличный интерактивный учебник. При необходимости можно найти решения, чтобы проверить себя. Задания простые и соответствуют уровню сложности.

«Поколение Python»: курс для начинающих. В курсе на Stepik рассказывают об основных типах данных, конструкциях и принципах программирования на Python. Материалы состоят из текстовой теории и более 500 задач с автоматической проверкой.

«Питонтьютор». Простой курс по Python требует только браузера. Внутри — 11 тем, в каждой 5—6 практических задач, встроенных прямо в материал.

«Программирование на Python». Еще один курс на Stepik позволит освоить в том числе и базовые библиотеки для работы с данными.

«Нейронные сети и компьютерное зрение». Курс поможет быстро изучить PyTorch  , а заодно и компьютерное зрение со сверточными нейронными сетями. Ключевой недостаток — в заданиях встречается сложная математика.

Совет № 5

Погрузитесь в математику для анализа данных

Весь анализ данных строится на математике. В задачах значимую роль часто играют статистические свойства данных: точечные оценки математического ожидания, дисперсии, характеристики распределения вероятности в данных и его тип и так далее. Хотя многие разделы матстата находятся далеко за границей школьных знаний, почему бы не заглянуть в высшую математику.

Что нужно знать

Область знанийКонкретные понятия
Дискретная математикаТеория множеств, алгебра логики, графы, комбинаторика
Линейная алгебраМатрица, определители, собственные значения
Теория вероятностей и математическая статистикаСлучайные события, вероятности, случайные величины и их распределения, формула Байеса, проверка статистических гипотез, например о равенстве математических ожиданий двух случайных величин
Математический анализПроизводная, интеграл, градиентный спуск

Что нужно знать

Область знанийКонкретные понятия
Дискретная математикаТеория множеств, алгебра логики, графы, комбинаторика
Линейная алгебраМатрица, определители, собственные значения
Теория вероятностей и математическая статистикаСлучайные события, вероятности, случайные величины и их распределения, формула Байеса, проверка статистических гипотез, например о равенстве математических ожиданий двух случайных величин
Математический анализПроизводная, интеграл, градиентный спуск

«Статистика и котики» Владимира Савельева. Легендарная простая книга, которая позволит разобраться в основах теории вероятностей и математической статистики. Читается очень легко даже в 9 классе. Стоит около 650 ₽ на «Озоне».

Математика для Data Science от «Академии искусственного интеллекта». Адаптированный для школьников курс математики для анализа данных. По отзывам, материал непростой, но достаточно понятный.

«Математика для Data Science» от karpov.courses. Легкий курс для студентов, тяжелый для школьников. Тем не менее он по-настоящему приближает к знаниям математики, необходимым для решения задач. Например, помогает разобраться, как работает градиентный спуск, как решать задачи оптимизации.

Совет № 6

Освойте дополнительные инструменты для работы

У школьников на соревнованиях все как у взрослых на работе: нужно управлять разработкой, работой моделей. Для этого нужно изучить несколько специфических тем. Эти знания хоть и не относятся к ИИ, но обязательно понадобятся на олимпиадах.

Что нужно знать

Область знанийКонкретные понятия
Работа с кодом в командеGit: создание и управление репозиторием, разрешение конфликтов при ведении веток
КонтейнеризацияDocker

«Основы работы с Git и GitHub». Простой курс для новичков в системах контроля версий и Git в частности.

Git и Docker. Еще один курс от «Академии искусственного интеллекта», но уже по Git и Docker. Содержит всю необходимую для школьника информацию, есть отдельный урок про Git и машинное обучение.

«Docker с нуля». Глубокий курс по работе с контейнерами и другими веб-технологиями для желающих разобраться в нюансах. На олимпиадах разработчики любят давать сложные контейнеры, которые бывает достаточно тяжело развернуть. Глубокие знания о контейнерах позволят не переживать на этот счет — и сосредоточиться на решении задачи.


Новости из мира образования, советы по карьере и учебе, вдохновляющие истории — в нашем телеграм-канале: @t_obrazovanie

Алексей ЕгоровБудете учить своих детей машинному обучению?
Подобрано специально для вас