Danetyka —
nauka o danych

Indywidualne szkolenia z analizy danych, uczenia maszynowego oraz programowania w R

Co oferuję?

Prowadzę szkolenia/lekcje online z analizy danych, statystyki i uczenia maszynowego w środowisku R. Specjalizuję się w przygotowaniu do pracy w firmach związanych z data science oraz w pomocy naukowcom w analizach statystycznych. Na stronie znajdziesz informacje, jak takie zajęcia wyglądają, jaki jest koszt i dlaczego warto go ponieść. Oprócz tego w dziale Analizy umieszczam swoje przykładowe analizy statystyczne, a na Blogu krótkie wpisy o zastosowaniu statystyki w życiowych problemach, często na pierwszy rzut oka niemających wiele wspólnego z liczbami.

Prowadzę również szkolenia z analizy danych dla zespołów analityków w firmach (stacjonarnie i zdalnie). Jeśli interesuje Was taka forma, napiszcie, prześlę ofertę.

Komu się to przyda?

Szkolenia przeznaczone są dla każdego, kto chciałby się nauczyć, jak analizować dane i budować modele uczenia maszynowego. Poniżej podaję przykładowe grupy osób, które mogłyby być szczególnie zainteresowane.

Poszukujący pracy

Chcielibyście pracować w firmie, która wymaga umiejętności analizowania danych lub budowania modeli.

Pracownicy

Zajmujecie się profesjonalnie analizą danych i chcielibyście się skonsultować lub szukacie kogoś, kto przeszkoli Wasz zespół.

Studenci

Studiujecie na kierunku związanym z data science i czujecie, że nie jest to wystarczające źródło wiedzy.

Naukowcy

Pracujecie naukowo i potrzebujecie pomocy z przeprowadzeniem analizy statystycznej do publikacji.

Jak to działa?

Szkolenia online

Lekcje odbywają się online przy pomocy Zoom z funkcją dzielenia ekranu. Dzięki temu widzę Wasz pulpit i możemy pracować tak, jakbym siedział obok. Wszystkie dane i skrypty, na których będziemy pracować, przesyłam w trakcie spotkania.

Plan

Na pierwszej lekcji ustalamy plan: jak często chcemy się umawiać i jaki program realizujemy. Jeśli Waszym celem jest praca w konkretnej branży, ale nie wiecie, czego warto się nauczyć, dojdziemy do tego.

Wymagania

Nie zakładam żadnych wstępnych umiejętności z matematyki, statystyki i programowania. Zresztą szybko przekonacie się, że aby analizować dane oraz zrozumieć i efektywnie używać metod uczenia maszynowego, znajomość wyższej matematyki i technik programowania nie jest konieczna.

Terminy

Lekcji udzielam od poniedziałku do soboty w godzinach 9-18. Ustalamy stałe godziny (na przykład raz w tygodniu), ewentualnie umawiamy się na bieżąco, z odpowiednim wyprzedzeniem.

Czego dokładnie uczę?

Poniżej podaję konkretne szkolenia, które zwykle realizuję. Ich głównym celem nie jest nauka kwestii technicznych (znajdziecie tańsze źródła, które Was tego nauczą). Zamiast tego skupiamy się na odpowiednim podejściu do analizy danych, wyrobieniu intuicji. Dzięki temu żadne dane ani metody statystyczne nie będą Wam straszne, bo będziecie to wszystko “czuć”. Po kliknięciu na zdjęcie, zapoznacie się ze szczegółowym planem całego szkolenia, wraz z informacją, ile czasu zwykle zajmuje. Jest to jednak dość indywidualne, bo tempo staram się dostosować do poziomu, na którym jesteście. Jeśli np. umiecie programować, zwykle szkolenie trwa krócej.

Najważniejsze szkolenie w ofercie. Zaczynamy od podstaw R i analizy danych, ucząc się tych rzeczy równolegle (to znaczy wykorzystujemy R od razu do najpopularniejszych problemów  związanych z danymi). Szkolenie nie ma nic wspólnego z popularnymi kursami statystyki na studiach, ale przerabiamy to, co rzeczywiście jest wykorzystywane w praktyce. Po jego ukończeniu będziecie wiedzieć, jak zabrać się do analizy, jak przekształcać dane, jak najlepiej je podsumować, jak tworzyć wysokiej jakości wykresy i jak badać zależności między cechami. Zobacz program.

Kontynuacja szkolenia z podstaw R i analizy danych. Nauczycie się trochę bardziej złożonych operacji, ale koniecznych w pracy analityka, m.in. łączenia danych z kilku plików czy zmiany kształtu (tabele przestawne). Oprócz czego dowiecie się, jak wykorzystać R, by stworzyć profesjonalnie wyglądający raport, powiemy sobie trochę o szeregach czasowych i elementach statystyki (tylko to, co jest wykorzystywane w praktyce). Przejdziemy też przez dwa dłuższe zadania, o których rozwiązanie zostały poproszone osoby starające się o pracę w pewnych firmach zajmujących się analizą danych. Zobacz program.

Od czego zależy długość naszego życia? Ile dni dłużej będę żył, jeśli zacznę biegać pół godziny dziennie? Na wiele relacji między zmiennymi wpływ ma szereg czynników, których nie jesteśmy w stanie uwzględnić, stosując podstawowe techniki analizy danych. W wielu takich sytuacjach wystarczy jednak zbudować odpowiedni model. Na tym szkoleniu dowiecie się, jak użyć modelowania do podsumowania relacji, do prognozy, do badania przyczynowości oraz do wyjaśniania, dlaczego dana zmienna przyjmuje takie a nie inne wartości. Szkolenie można też potraktować jako wstęp do uczenia maszynowego. Zobacz program.

Na szkoleniu dowiecie się, że uczenie maszynowe to nie zbiór magicznych zaklęć, ale zestaw dość podstawowych technik, wcale nietrudnych do opanowania. Przekonacie się, że temat nie jest tak ciężki, jak go przedstawiają, a możliwe zastosowania naprawdę potężne. Głównym celem jest poznanie jednego z najpopularniejszych i najlepszych algorytmów, tzw. lasu losowego (Random Forest). Po szkoleniu powinniście móc z powodzeniem zbudować model, który będzie można komercyjnie wykorzystać. Zobacz program.

Jeśli budowa modeli uczenia maszynowego to główne zadanie, jakim chcecie się zajmować, podstawowe algorytmy najprawdopodobniej okażą się niewystarczające. Na tym szkoleniu poznasz inne, w tym uważany obecnie za najpotężniejszy, Extreme Gradient Boosting (wygrywający większość konkurencji na kaggle.com). Oprócz tego dowiesz się o metodach wspomagających budowę modelu (PCA), jak również o tzw. uczeniu bez nadzoru (analiza skupień). Zobacz program.

Szkolenie dla osób, które chciałyby poznać jeden z najbardziej złożonych algorytmów uczenia maszynowego, sieć neuronową. Zaczniemy od najprostszych wersji, a skończymy na naprawdę skomplikowanym modelu do rozpoznawania obrazów. Wykorzystamy bibliotekę Keras, jeden z najpopularniejszych interfejsów dla TensorFlow. Szkolenie przeznaczone również dla pasjonatów, których interesuje temat sztucznej inteligencji. Zobacz program.

Nauczycie się, jak przy pomocy R i pakietu shiny tworzyć w relatywnie prosty sposób świetnie wyglądające aplikacje. W trakcie lekcji stworzymy od zera kilkanaście działających aplikacji — być może niektóre z nich przydadzą się w Waszej codziennej pracy. Dowiecie się, czym jest programowanie reaktywne, gdyż bez tej wiedzy ciężko napisać od zera swoją aplikację (pozostaje jedynie modyfikacja gotowych). Przedstawię również proces umieszczania aplikacji na serwerze oraz podzielę się mnóstwem dobrych praktyk, które optymalizują pracę z shiny. Zobacz program.

Program przeznaczony dla pracowników naukowych oraz ambitnych studentów, którzy chcieliby zrozumieć, jak weryfikuje się hipotezy, czym są przedziały ufności, p-wartość, testy t-Studenta, ANOVA czy regresja liniowa. Materiał pokrywa się mniej więcej z kursami statystyki na studiach, z tą różnicą, że naprawdę staram się wytłumaczyć, o co w tym chodzi. W szczególności na szkoleniu zyskać mogą osoby, które chcą przeprowadzić analizę statystyczną i poprawnie opisać wyniki do publikacji naukowej, jak również obronić się przed zarzutami recenzentów. Zobacz program.

Jeśli znacie R dość dobrze, ale czujecie, że można wycisnąć z niego jeszcze więcej, macie rację. Na tym szkoleniu dowiecie się między innymi, jak szukać błędów w kodzie (oraz jak pisać, żeby popełniać ich jak najmniej), na czym polega programowanie obiektowe i funkcyjne, jak pisać dobre funkcje oraz jak samemu stworzyć pakiet R wraz z dokumentacją (oraz udostępnić go całemu światu). Poznacie również techniki, o których być może nawet nie wiedzieliście, że istnieją, a które bardzo usprawnią Waszą współpracę z R oraz jakimkolwiek innym językiem. Zobacz program.

Dlaczego warto?

Na rynku istnieje sporo firm prowadzących szkolenia z analizy danych, które realizują podobny program do mojego. Poniżej podaję kilka argumentów, dlaczego warto skorzystać akurat z mojej oferty.

Lekcje indywidualne

Lekcje odbywają sam na sam, dzięki czemu mogę dostosować sposób tłumaczenia do Waszego poziomu i wiedzy, jaką już posiadacie. Możemy zrezygnować z danej części materiału, jeśli nie jest dla Was ważna, ewentualnie ją rozszerzyć, jeśli uważacie, że będzie szczególnie przydatna.

Odpowiednie tempo

Umawiamy się na maksymalnie kilka lekcji w tygodniu. Analiza danych i uczenie maszynowe to tak rozległe tematy, że próba opanowania ich w kilka dni (jak to zwykle wygląda na szkoleniach) jest skazana na porażkę. Trzeba to na spokojnie przećwiczyć i dać mózgowi czas na przyswojenie.

Zadania domowe

Po każdej lekcji zadaję prace domowe do rozwiązania w czasie między spotkaniami, które następnie konsultujemy. Są one nieodłączną i kluczową częścią szkolenia. Niestety nie da się nauczyć analizy danych bez własnej pracy.

Indywidualne problemy

Poza głównym szkoleniem możemy równolegle pracować na Waszych danych albo rozwiązywać konkretne problemy, z którymi macie do czynienia w pracy lub na studiach.

Możliwość rezygnacji

Ponieważ nie płacicie za całość szkolenia, w dowolnym momencie możecie zrezygnować, jeśli poczujecie, że mój sposób przekazywania wiedzy nie trafia do Was albo zmieniła się Wasza sytuacja i nie macie już czasu lub chęci, by kontynuować naukę.

Długa współpraca

Z osobami, które się do mnie zgłaszają, zwykle współpracuję po kilka lat. Na etapie przygotowania do zawodu, szukania pracy i pierwszych miesięcy w firmie. Dzięki temu wiem, jakie umiejętności są ważne — i właśnie ich staram się nauczyć. Wiem też, o co pytają na rozmowach kwalifikacyjnych.

Czemu nie Python?

Dobre pytanie. Tak, w przeważającej liczbie ogłoszeń o pracę w data science wymagany jest Python, nie R. Powodów jest wiele: m.in. Python jest językiem ogólnego zastosowania, więc wiele osób poznaje go swoją drogą, niekoniecznie z myślą o analizie danych. A jak już go znam, po co uczyć się innego języka, skoro w Pythonie można robić to dobrze?

Czy jednak Python jest lepszy od R w analizie danych? Odpowiem na inne pytanie: który język jest najlepszy do NAUKI analizy danych? Jestem przekonany, że R. Został zaprojektowany przez analityków i dla nich. Składnia, funkcje i ich domyślne parametry, prostota techniczna i czytelność — to wszystko powoduje, że analizowanie danych w R jest znacznie naturalniejsze niż w Pythonie. W nauce najważniejsze jest wyrobienie pewnych intuicji, a to łatwiej to osiągnąć w R.

W końcu najpewniej i tak warto nauczyć się Pythona. Ale jeśli miałbym wskazać optymalną ścieżkę rozwoju w kierunku data science, to jest to nauka analizowania danych w R, a dopiero potem Python. Ostatecznie kończymy ze znajomością dwóch języków, co jest typowe wśród najlepszych osób z branży.

I jeszcze bardzo praktyczny, finansowy argument. Jeśli chcecie pracować w naprawdę dobrej firmie (interesujące problemy plus duże zarobki), najlepsza strategia, żeby to osiągnąć, to jak najszybsze zatrudnienie w mniej wymagającej firmie (ale na stanowisku związanym z analizą danych) i zwolnienie maksymalnie po roku. W tym czasie poszerzacie swoją wiedzę z data science (przy okazji zarabiając), a potem aplikujecie do tej lepszej firmy (możecie nawet próbować od razu na wyższe stanowisko).  Tylko żeby dostać się do tej pierwszej firmy, musicie coś umieć. Analizy danych nauczycie się zdecydowanie szybciej w R (abstrahując od tego, że dodatkowo wyrobicie sobie lepszą intuicję). Poza tym, mimo że ogłoszeń z Pythonem jest więcej, znaczenie ma jeszcze to, z iloma osobami konkurujecie o dane stanowisko. A Pythona zna ZNACZNIE więcej osób niż R!

Jednym słowem, tę pierwszą pracę, z którą i tak pożegnacie się za jakiś czas, znajdziecie szybciej, ucząc się R. Dzięki temu proces zatrudnienia w wymarzonej firmie będzie znacznie krótszy (i szybciej będziecie zarabiać duże pieniądze).

Kim jestem?

Piotr Szulc szkolenia z analizy danych

Nazywam się Piotr Szulc, od 2012 roku prowadzę szkolenia z analizy danych. Środowiska R używam na co dzień, wykonując analizy statystyczne i tworząc modele predykcyjne. Biorę też udział w jego rozwoju, tworząc nowe pakietów (bigstep). Współpracuję z wrocławskimi firmami windykacyjnymi (m.in. pawum.pl), jak również z psychologami i lekarzami, pomagając w wykonaniu analiz do publikacji naukowych.

Z wykształcenia jestem matematykiem/statystykiem (uzyskałem stopień doktora na Wydziale Matematyki PWr). Naukowo zajmowałem się zastosowaniami modeli regresji na danych genetycznych. Współpracowałem z Politechniką Wrocławską (7 lat), Uniwersytetem Stanforda (5 lat), Uniwersytetem Wiedeńskim (5 lat) oraz Uniwersytetem Wrocławskim (1 rok). Prezentowałem referaty na kilkunastu krajowych i zagranicznych konferencjach naukowych, m.in. reprezentowałem Polskę na prestiżowej konferencji 18th European Young Statisticians Meeting.

Jak wiele osób prowadzących szkolenia, zaczynałem od korepetycji. Jeśli chcielibyście przeczytać opinie na mój temat, zapraszam tutaj, po więcej szczegółów odsyłam na mój profil na LinkedIn. A jeśli chcecie upewnić się, czy nie mam jakiegoś irytującego głosu, tutaj krótki fragment lekcji.

Ile to kosztuje?

Koszt pierwszych dziesięciu lekcji to 250 zł za 45 minut. Potem otrzymujecie status “stałego klienta” i każda kolejna kosztuje 200 zł za 45 minut. Moim zdaniem optymalnie jest umawiać się raz w tygodniu na dwie lekcje od razu. Po pierwszych 45 minutach robimy 15 min przerwy (oczywiście nie jest wliczona w cenę).

Wydatek na całe szkolenie oczywiście nie jest mały. Moim głównym celem jest zrobienie z Was analityków danych — i to dobrych. Założenie jest takie, że po jakimś czasie (który w dużej mierze zależy od Was) znajdziecie pracę w branży, która jak pewnie wiecie, jest obecnie jedną z najlepiej płatnych. Także jeśli wszystko pójdzie dobrze, koszt szkolenia to Wasza pierwsza wypłata.

Jeśli mimo to nie możecie sobie pozwolić na taki wydatek (bo np. wcale nie szukacie pracy w data science), a pracujecie na uczelni, zapytajcie w sekretariacie, czy jest możliwość
sfinansowania szkolenia (wielu moich klientów w ten sposób się rozlicza). Być może też za całe szkolenie zapłaci firma, w której już pracujecie.

Jak się skontaktować?

Jeśli jesteście zainteresowani szkoleniem lub konsultacją, wypełnijcie poniższy formularz. Jeśli macie wątpliwości albo po prostu chcecie o coś dopytać, również napiszcie. Wszystkie kwestie ustalimy mailem lub podczas pierwszej lekcji.