Machine Learning Colloquium

Machine Learning

Вопросы к коллоквиуму

  1. Задачи машинного обучения. Обучение с учителем. Обучение без учителя. Регрессия. Классификация. Кластеризация.
  2. Приближение функции многочленами. Задача, модель, функция потерь. Проблема переобучения на примере интерполяции. Зачем нужно разбиение выборки на тренировочную и тестовую часть. Кросс-валидация.
  3. Линейная регрессия. Задача и модель линейной регрессии. Регуляризация.
  4. Логистическая регрессия. Задача и модель бинарной логистической регрессии.
  5. Метрики классификации: accuracy, precision, recall, F1, ROC-AUC. Multi-label классификация.
  6. Задача кластеризации. K-means. DBSCAN. Агломеративная кластеризация.
  7. Задача уменьшения развопромерности. SVD. PCA. T-SNE.
  8. Решающие деревья. Алгоритм построения решающего дерева. Кросс-энтропия.
  9. Ансамбль алгоритмов. Бэггинг. Случайный лес. Градиентный бустинг.
  10. Обработка текстов. Токенизация, Лемматизация, CountVectorizer, OneHotVectorizer, Стемминг. Word2vec (идея, какие полезные свойства эмбеддингов дает).
  11. Релевантность документа. Задача проверки на релевантность документа на запрос. TF-IDF.
  12. Теория вероятности. Вероятность. Условная вероятность. Формула Байеса. Формула полной вероятности. Распределения вероятностей. Метод максимального правдоподобия. Наивный байесовский классификатор.
  13. Линейная алгебра. Матрицы: определитель, обратная матрица, алгоритмы обращения матриц, собственные значения и векторы матрицы, SVD, матричное дифференцирование, аналитическое решение задачи линейной регрессии.