Uczenie maszynowe

Jeśli budowa modeli uczenia maszynowego to główne zadanie, jakim chcecie się zajmować, podstawowe algorytmy najprawdopodobniej okażą się niewystarczające. Na tym szkoleniu poznasz inne, w tym uważany obecnie za najpotężniejszy, Extreme Gradient Boosting (wygrywający większość konkurencji na kaggle.com). Oprócz tego dowiesz się o metodach wspomagających budowę modelu (PCA), jak również o tzw. uczeniu bez nadzoru (analiza skupień).

Wymagania. Szkolenie z podstaw R i analizy danych, szkolenie z modelowania, szkolenie z podstaw uczenia maszynowego.

Czas. Lekcje indywidualne:  20 lekcji po 45 minut.  Szkolenia dla grup:  4 dni po 6 godzin. Ewentualnie krócej, jeśli interesują Was tylko niektóre z algorytmów.

1. Boosting

- Adaptive Boosting
- Extreme Gradient Boosting
- Jak wybrać hiperparametry?

2. Support Vector Machine

- Wersja liniowa
- Wersja nieliniowa, jądro
- Support Vector Regression

3. Regularyzacja

- LASSO
- Regresja grzbietowa
- Elastic net

4. Regresja nieliniowa

- Regresja wielomianowa
- Funkcje schodkowe
- Krzywe sklejane (splines), regresja lokalna (loess)
- Uogólnione modele addytywne (GAM)

5. PCA

- Komponenty, ładunki, scores
- Wybór liczby składowych, kryterium Kaisera, wykres osypiska
- Rotacja
- Zastosowanie w wizualizacji
- Redukcja wymiaru
- Zastosowanie w regresji (PCR)

6. Analiza skupień

- Po co dzielić obserwacje na grupy?
- Metoda k-średnich
- Jak wybrać optymalną liczbę grup?
- Grupowanie hierarchiczne

7. Podsumowanie

- Porównanie metod
- Granica decyzyjna
- Jak ulepszyć istniejący model?