Analiza danych

Kontynuacja szkolenia z podstaw R i analizy danych. Nauczycie się trochę bardziej złożonych operacji, ale koniecznych w pracy analityka, m.in. łączenia danych z kilku plików czy zmiany kształtu (tabele przestawne). Oprócz czego dowiecie się, jak wykorzystać R, by stworzyć profesjonalnie wyglądający raport, powiemy sobie trochę o szeregach czasowych i elementach statystyki (tylko to, co jest wykorzystywane w praktyce). Przejdziemy też przez dwa dłuższe zadania, o których rozwiązanie zostały poproszone osoby starające się o pracę w pewnych firmach zajmujących się analizą danych.

Wymagania. Szkolenie z podstaw R i analizy danych.

Czas. Lekcje indywidualne:  16 lekcji po 45 minut.  Szkolenia dla grup:  3 dni po 6 godzin.

1. Schemat analizy danych

- Ogólne spojrzenie na proces analizy danych
- Pytania biznesowe
- Pytania deskryptywne, predykcyjne i normatywne
- Zadania z rozmów kwalifikacyjnych

2. Łączenie i zmiana kształtu danych

- Łączenie danych z kilku plików (join)
- Dane zewnętrzne
- Zmiana kształtu danych (pivot)

3. Bazy danych

- Jak poprawnie wczytać dane?
- Praca na danych zapisanych w bazie SQL
- Jak pracować nad większym projektem
- Podział skryptu na kilka plików

4. Tworzenie raportów w R

- Jak napisać raport w html, pdf lub doc
- Rmarkdown, YAML, chunk
- Formatowanie wykresów i tabel

5. Szeregi czasowe

- Jak wykorzystać datę w analizie danych?
- Trend i sezonowość
- Dekompozycja szeregu
- Funkcje okienkowe

6. Statystyka

- Próba i populacja
- Jak na podstawie wyników z próby wnioskować o całej populacji?
- Błąd standardowy, przedział ufności
- Metoda bootstrap
- Korelacja Pearsona i Spearmana
- Wartość oczekiwana

- Wzór Bayesa