Модуль даёт школьникам введение в анализ данных и технологии искусственного интеллекта с применением языка Python. Шаг за шагом ученики осваивают, как превращать таблицы и числа в осмысленные результаты: выявлять закономерности, строить наглядные графики и делать первые прогнозы на основе информации.
В следующей части курса участники переходят к основам машинного обучения. Они понимают, как алгоритмы «обучаются» на данных, и создают свои собственные модели — от простых классификаторов до игровых агентов, способных принимать решения самостоятельно.
Завершением модуля станет итоговый проект: каждый ученик подготовит и презентует работу с элементами ИИ, которую можно включить в своё портфолио.
План занятий:На этом занятии школьники совершают переход от анализа данных к практическому искусственному интеллекту. В короткой теоретической части они разбираются, что такое ИИ и машинное обучение, какие существуют типы задач (классификация, регрессия, кластеризация) и почему в рамках урока применяется обучение с учителем. На простых примерах закрепляются основные понятия: признаки (входные данные), целевая переменная (то, что нужно предсказать), модель и алгоритм.
Затем начинается практическая работа. Ученики загружают таблицу characters_stats.csv, выбирают признаки (например, интеллект, сила, скорость, выносливость, энергия, бой) и целевую метку «Альянс», разделяют данные на обучающую и тестовую выборки, тренируют модель решающего дерева (DecisionTreeClassifier) и оценивают её точность.
В завершение — интерактивная часть: каждый вводит свои «суперхарактеристики», а обученная модель определяет, к какому Альянсу он мог бы принадлежать. Для более быстрых учеников предусмотрено дополнительное задание: визуализировать дерево решений и понять, по каким правилам модель принимает решение.
Методический план модуля: - Введение в анализ данных и библиотеку Pandas: что такое данные и как с ними работать.
- Загрузка датасетов из CSV и первичный осмотр данных (head, tail, info, describe).
- Фильтрация по условиям: использование булевых масок и комбинирование правил.
- Сортировка и формирование тематических подборок (sort_values).
- Очистка данных: работа с пропусками, аномалиями, дубликатами (fillna, dropna).
- Создание признаков (Feature Engineering): генерация новых признаков для улучшения анализа.
- Группировка и сводные таблицы: groupby, value_counts, pivot_table.
- Визуализация данных: построение диаграмм, гистограмм, scatter-графиков и интерпретация результатов.
- Решение практической задачи: «цифровое расследование» и система оценки факторов.
- Машинное обучение (классификация): решающее дерево, библиотека scikit-learn, метрика accuracy.
- Машинное обучение (регрессия): линейная регрессия, метрики MSE/RMSE, создание предсказателя цены.
- Итоговый кейс и презентация: полный цикл работы от постановки вопроса до получения выводов, а также защита проекта и обратная связь.