Machine Learning Colloquium
Machine Learning
Вопросы к коллоквиуму
- Задачи машинного обучения. Обучение с учителем. Обучение без учителя. Регрессия. Классификация. Кластеризация.
- Приближение функции многочленами. Задача, модель, функция потерь. Проблема переобучения на примере интерполяции. Зачем нужно разбиение выборки на тренировочную и тестовую часть. Кросс-валидация.
- Линейная регрессия. Задача и модель линейной регрессии. Регуляризация.
- Логистическая регрессия. Задача и модель бинарной логистической регрессии.
- Метрики классификации: accuracy, precision, recall, F1, ROC-AUC. Multi-label классификация.
- Задача кластеризации. K-means. DBSCAN. Агломеративная кластеризация.
- Задача уменьшения развопромерности. SVD. PCA. T-SNE.
- Решающие деревья. Алгоритм построения решающего дерева. Кросс-энтропия.
- Ансамбль алгоритмов. Бэггинг. Случайный лес. Градиентный бустинг.
- Обработка текстов. Токенизация, Лемматизация, CountVectorizer, OneHotVectorizer, Стемминг. Word2vec (идея, какие полезные свойства эмбеддингов дает).
- Релевантность документа. Задача проверки на релевантность документа на запрос. TF-IDF.
- Теория вероятности. Вероятность. Условная вероятность. Формула Байеса. Формула полной вероятности. Распределения вероятностей. Метод максимального правдоподобия. Наивный байесовский классификатор.
- Линейная алгебра. Матрицы: определитель, обратная матрица, алгоритмы обращения матриц, собственные значения и векторы матрицы, SVD, матричное дифференцирование, аналитическое решение задачи линейной регрессии.