Modelowanie

Od czego zależy długość naszego życia? Ile dni dłużej będę żył, jeśli zacznę biegać pół godziny dziennie? Na wiele relacji między zmiennymi wpływ ma szereg czynników, których nie jesteśmy w stanie uwzględnić, stosując podstawowe techniki analizy danych. W wielu takich sytuacjach wystarczy jednak zbudować odpowiedni model. Na tym szkoleniu dowiecie się, jak użyć modelowania do podsumowania relacji, do prognozy, do badania przyczynowości oraz do wyjaśniania, dlaczego dana zmienna przyjmuje takie a nie inne wartości. Szkolenie można też potraktować jako wstęp do uczenia maszynowego.

Wymagania. Szkolenie z podstaw R i analizy danych.

Czas. Lekcje indywidualne:  16 lekcji po 45 minut.  Szkolenia dla grup:  3 dni po 6 godzin.

1. Na czym polega modelowanie?

- Podsumowanie relacji
- Prognozowanie
- Wyjaśnianie
- Przyczynowość
- Dwa rodzaje błędów

2. Regresja liniowa, część I

- Jak znaleźć parametry modelu regresji?
- Interpretacja (wersja uproszczona i precyzyjna)
- Jak podsumować model?
- Prognoza, przedział ufności
- Reszty -- jak można je wykorzystać?
- Skąd nazwa “regresja”?

3. Regresja liniowa, część II

- Zależności nieliniowe i interakcje
- Przykład biznesowy (problemy optymalizacyjne)
- Współliniowość
- Kryteria wyboru modelu

4. Regresja logistyczna, część I

- Związek między regresją logistyczną i liniową
- Interpretacja
- Jak podsumować model?
- Macierz błędów

5. Regresja logistyczna, część II

- Czułość i swoistość, precyzja i recall
- Pole pod krzywą ROC (AUC)
- Co zrobić, gdy mamy więcej niż dwie klasy?