Jak analizować dane? Kurs dla początkujących

Co oferuję?

Prezentowany tu kurs jest dedykowany początkującym analitykom, osobom, które chciałyby wejść w świat data science, jak również użytkownikom Excela, którzy czują, że nie jest to optymalne narzędzie do zadań, które wykonują.

Jeśli interesuje Cię praca w data science, istnieje wiele narzędzi wykorzystywanych w tej dziedzinie, których listę znajdziesz w ogłoszeniach o pracę: SQL, Python, R, Power BI, Excel, AWS itp. Nauczysz się tego wszystkiego z tutoriali lub darmowych kursów na Udemy czy Coursera. Problem w tym, że nie to jest istotą data science. Przede wszystkim, musisz umieć analizować dane. Mimo że brzmi prosto, to zdecydowanie najtrudniejsza i najważniejsza umiejętność analityka. Co więcej, brakuje materiałów, które przedstawiają temat z właściwej perspektywy.

A może już umiesz analizować dane, ale do tej pory robiłaś/robiłeś to w Excelu i czujesz, że da się lepiej. Wtedy najlepsze, w co możesz zainwestować, to nauka programowania. Najprostszym i najlepszym językiem do analiz danych jest obecnie R (tutaj wyjaśniam, dlaczego nie Python), dlatego wszystkie materiały, na których się opieram, są napisane w tym języku.

Na tej stronie znajdziesz informacje, jak wygląda mój pomysł na naukę, czego konkretnie uczę, jakie materiały ode mnie dostaniesz (będzie ich bardzo dużo) oraz jakie mam doświadczenie.

Uwaga. To NIE jest kurs z języka R (choć nauczysz się go przy okazji i to bardzo dobrze), ale z analizy danych, w optymalnym do tego celu narzędziu: języku programowania.

Kim jestem?

piotr szulc statystyka

Nazywam się Piotr Szulc, od 2012 roku zajmuję się analizą danych, statystyką i uczeniem maszynowym, zarówno od strony komercyjnej, jak i naukowej. Na co dzień używam środowiska R, jestem m.in. twórcą pakietu bigstep. Współpracuję z wrocławskimi firmami z branży finansowej, jak również z biostatystykami, lekarzami i psychologami, pomagając w wykonaniu analiz do publikacji naukowych. Prowadzę blog o statystyce, uczestniczę w turniejach kaggle, a czasem je wygrywam. Niedawno wystartował mój kanał na youtube.

Z wykształcenia jestem matematykiem/statystykiem (uzyskałem stopień doktora na Wydziale Matematyki PWr). Naukowo zajmowałem się zastosowaniami modeli regresji na danych genetycznych. Współpracowałem z Politechniką Wrocławską (7 lat) oraz Uniwersytetem Stanforda (5 lat). Prezentowałem referaty na kilkunastu konferencjach naukowych, m.in. reprezentowałem Polskę na 18th European Young Statisticians Meeting. Publikowałem artykuły w najlepszych czasopismach naukowych (Genetics).

Obecnie najwięcej czasu przeznaczam na dokształcanie naukowców w dziedzinie statystyki i opowiadanie o tym, jak analizować dane. Po więcej szczegółów odsyłam na mój profil na LinkedIn.

Jak to działa?

Poznajemy się

Wyślij wiadomość przez formularz na końcu strony, opisz swoje doświadczenie z analizą danych i programowaniem (lub jego brak) oraz co jest Twoim celem. Prześlę Ci też krótką ankietę, żeby lepiej oszacować Twoją dotychczasową wiedzę.

Materiały

Po pierwszej wpłacie przesyłam materiały do lekcji: skrypty z zadaniami, dane i artykuły pogłębiające temat. Jeśli interesuje Cię praca w data science, dostaniesz też zadania z rozmów rekrutacyjnych (z odpowiedziami), projekty wysyłane kandydatom do wykonania przed rozmową, rady odnośnie do CV, budowy portfolio itp.

Spotkanie

W skład każdej lekcji wchodzi 45-minutowe spotkanie ze mną. Można je przeznaczyć na wprowadzenie do tematu lub na pytania tyczące się poprzedniej lekcji, szczególnie jeśli gdzieś utkniesz. Zadanie są tak skonstruowane, że w dużej mierze poradzisz sobie samemu, bez mojej pomocy.

Terminy

Spotkania mogą się odbyć od poniedziałku do soboty w godzinach 9-18. Ustalamy stałe godziny (na przykład raz w tygodniu), ewentualnie umawiamy się na bieżąco, z odpowiednim wyprzedzeniem. Żeby nauka miała sens, powinnaś/powinieneś być w stanie przeznaczyć kilka godzin w tygodniu na pracę własną.

Materiały

W poniższym filmie pokazuję dokładnie, jakie materiały ode mnie dostaniesz. Wstęp nagrałem z myślą o osobach, które chciałby zacząć pracę w branży data science.

Czego konkretnie uczę i jaki jest koszt?

Szczegółowy opis kursu znajduje się tutaj. Zaczynamy od podstaw programowania w R i analizy danych, następnie uczymy się, jak zmieniać kształt danych (pivot, tabele przestawne), łączyć bazy z kilku plików (join), jak badać zależności między zmiennymi, jak tworzyć złożone wykresy (jest to najważniejsze narzędzie analityka!), czy jak analizować dane czasowe.

Kurs jest podzielony na 10 części, koszt każdej to 320 zł. Po wpłacie przesyłam materiały do kolejnej części (czyli nie trzeba płacić za całość). W cenie każdej jest 45-minutowe spotkanie ze mną (w sumie 10 spotkań).

Jest też tańsza opcja. Umawiamy się na pierwsze spotkanie (320 zł), a potem pracujesz samemu, bez spotkań (zadania są tak skonstruowane, że nie powinno być z tym problemu). Jeśli gdzieś utkniesz, możesz „dokupić” spotkanie, koszt to 160 zł (czyli sumuje się do 320, jak w poprzedniej opcji). Podsumowując, całkowity koszt to 320 zł za pierwszą lekcję i spotkanie, a potem 1440 zł za wszystkie pozostałe materiały (9 lekcji). To pierwsze spotkanie jest potrzebne między innymi po to, żebym wyjaśnił, jak pracować z materiałami. I możesz dopiero po nim (i po przerobieniu całego materiału z pierwszej lekcji) zdecydować, czy chcesz zapłacić za całość.

Jeśli spodoba Ci się współpraca ze mną, to lista wszystkich moich kursów jest znacznie dłuższa i znajduje się tutaj.

Co wyróżnia naukę ze mną?

Przygotowanie dydaktyczne

Mam za sobą ponad 2500 godzin szkoleniowych, z czego połowa to indywidualne lekcje. Ponieważ na takich spotkaniach sam na sam łatwo o feedback, uważam, że wiem, jak przekazywać wiedzę (w jaki sposób mówić, jakie przykłady pokazać itd.), by druga osoba NAPRAWDĘ zrozumiała dany temat.

Aktualizacja materiału

Szkolenia modyfikuję w trybie ciągłym. Rozwój języka R, ale też samego podejścia do analizy danych, jest tak szybki, że program, który ma dwa lata, jest już przestarzały. Zwykle uaktualniam go co kilka miesięcy, dzięki czemu uczycie się tego, co w tym momencie jest uznawane za najlepsze.

Istota data science

W data science najważniejsza jest umiejętność zadawania pytań i tłumaczenia problemów biznesowych na statystyczne, detektywistyczne podejście i krytyczne myślenie. Według mojej wiedzy nie nauczycie się tego na żadnym typowym szkoleniu czy studiach podyplomowych (które skupiają się na programowaniu i technikach statystycznych). My będziemy to ćwiczyć na każdej lekcji.

Możliwość rezygnacji w dowolnym momencie

Ponieważ płacisz tylko za jedną lekcję, w dowolnym momencie możesz zrezygnować, jeśli poczujesz, że mój sposób przekazywania wiedzy do Ciebie nie trafia. Albo zmieniła się Twoja sytuacja i nie masz już czasu, by kontynuować naukę.

Osobiste zaangażowanie

Nie jestem żadną "wielką firmą", wszystko prowadzę sam: umawiasz się ze mną, ja przygotowałem materiały, każde spotkanie jest ze mną. Jestem bardzo zaangażowany w to, co robię, i zwyczajnie zależy mi, żeby Cię jak najwięcej nauczyć.

Jak się skontaktować?

Jeśli moja oferta wydaje Ci się interesująca, wypełnij formularz. A jeśli nie lubisz formularzy, napisz bezpośrednio na poniższy adres:

piotr szulc

Jak dogadamy się z terminem, prześlę szczegóły techniczne: jak się łączymy, jak wyglądają płatności itp.
 

Może brak Ci pewności, czy moja oferta jest dla Ciebie? Napisz, postaram się rozwiać wątpliwości.

Jeśli chcesz zorganizować szkolenie dla większej grupy, zapraszam tutaj.

    Wypełniając formularz swoimi danymi, zgadzasz się na ich przetwarzanie w celu kontaktu z Tobą na zasadach określonych w polityce prywatności.

    Czemu nie Python?

    Zgadza się, w przeważającej liczbie ogłoszeń o pracę w data science wymagany jest Python, nie R. Trzeba jednak odróżnić proces NAUKI analizy danych od późniejszego STOSOWANIA tej wiedzy w firmie. W przeciwieństwie do Pythona, to R został stworzony do analizy danych i jej nauka w tym języku jest zupełnie naturalna. Nie dość, że można skupić się na jej istocie (zamiast na kwestiach programistycznych), to dodatkowo dzięki odpowiedniej składni wyrobisz sobie właściwe podejście, nawyki, intuicję.

    Obecnie coraz więcej osób chce jednocześnie nauczyć się programować w Pythonie i niejako przy okazji analizy danych (lub odwrotnie). Nie twierdzę, że tego nie da się zrobić, natomiast jeśli chcesz być naprawdę dobry/dobra w swojej pracy, nie jest to optymalne podejście.

    Oprócz tego, jeśli do tej pory korzystałaś/korzystałeś z Excela, nauka Pythona może okazać się zbyt trudna. Po drugie: niepotrzebna (tzn. do Twoich zastosowań R będzie wystarczający). A po trzecie, praca w R zajmuje mniej czasu, tzn. szybciej dochodzi się do odpowiedzi, co jest oczywiście bardzo ważne w biznesie.

    Weź też pod uwagę, że narzędzia się zmieniają i szczerze wątpię, by za 10 lat ktoś pamiętał o Pythonie, przynajmniej w analizie danych. O R też — powstanie po prostu inne narzędzie. Także zamiast skupiać się na nauce konkretnego języka, lepiej zainwestować w jak najlepsze zrozumienie istoty analizy danych.

    Jeśli chcesz pracować w data science, po jakimś czasie najpewniej warto douczyć się Pythona. Jest to już łatwe, gdy znasz R. Ostatecznie kończysz ze znajomością dwóch języków, co jest typowe wśród najlepszych osób z branży.