Правила коллоквиума
- Билет состоит из трех вопросов: двух по теории, которые берутся из списка ниже, и одного по практике, который заранее не известен.
- В течении всего экзамена должны быть включены камера, микрофон, показ экрана.
- В случае обнаружения факта попытки списать коллоквиум заканчивается оценкой неуд.
Теоретические вопросы
-
Задачи машинного обучения
Обучение с учителем. Обучение без учителя. Регрессия. Классификация. Кластеризация. -
Приближение функции многочленами
Задача, модель, функция потерь. Проблема переобучения на примере интерполяции. Зачем нужно разбиение выборки на тренировочную и тестовую часть. Кросс-валидация. -
Линейная регрессия
Задача и модель линейной регрессии. Регуляризация. -
Логистическая регрессия
Задача и модель бинарной логистической регрессии. -
Метрики классификации
Метрики классификации: accuracy, precision, recall, F1, ROC-AUC. Multi-label классификация. -
Кластеризация
Задача кластеризации. K-means. DBSCAN. Агломеративная кластеризация. -
Уменьшение размерности
Задача уменьшения размерности. SVD. PCA. T-SNE. -
Решающие деревья
Алгоритм построения решающего дерева. Кросс-энтропия. -
Ансамблирование
Ансамбль алгоритмов. Бэггинг. Случайный лес. Градиентный бустинг. -
Обработка текстов
Токенизация, Лемматизация, CountVectorizer, OneHotVectorizer, Стемминг. Word2vec (идея, какие полезные свойства эмбеддингов дает). -
Релевантность документа
Задача проверки на релевантность документа на запрос. TF-IDF. -
Рекомендательные системы
Постановка задачи. Бейзлайны. Фильтрация на основе содержания (content-based approach). Кол- лаборативная фильтрация. -
Теория вероятности
Вероятность. Условная вероятность. Формула Байеса. Формула полной вероятности. Распреде- ления вероятностей. ММП. Наивный байесовский классификатор. -
Линейная алгебра, матрицы
Определитель, обратная матрица, алгоритмы обращения матриц, собственные значения и век- торы матрицы, SVD, матричное дифференцирование, аналитическое решение задачи линейной регрессии