Szkolenia z języka R dla naukowców
Co oferuję?
Prowadzę szkolenia ze statystyki oraz programowania w języku R, dedykowane pracownikom naukowym. Uczymy się równolegle R oraz poprawnego wykonywania analiz statystycznych (dobierania odpowiednich testów statystycznych, interpretacji p-wartości itd.). Oczywiście jeśli znasz statystykę i narzędzia typu SPSS czy Statistica, będzie łatwiej — natomiast nie zakładam tego.
Na stronie znajdziesz informacje, jak wygląda mój pomysł na naukę, czego konkretnie uczę, jakie materiały ode mnie dostaniesz oraz jakie mam doświadczenie.
Szkolenia mogą się odbyć zarówno w grupie (np. na uczelni), jak i indywidualnie.
Kim jestem?
Nazywam się Piotr Szulc, od 2012 roku zajmuję się analizą danych, statystyką i uczeniem maszynowym, zarówno od strony komercyjnej, jak i naukowej. Na co dzień używam środowiska R, jestem m.in. twórcą pakietu bigstep. Współpracuję z biostatystykami, lekarzami i psychologami, pomagając w wykonaniu analiz do publikacji naukowych. Prowadzę blog o statystyce, uczestniczę w turniejach kaggle, a czasem je wygrywam. Pracuję jako senior data scientist w firmie Molecure.
Z wykształcenia jestem matematykiem/statystykiem (uzyskałem stopień doktora na Wydziale Matematyki PWr). Naukowo zajmowałem się zastosowaniami modeli regresji na danych genetycznych. Współpracowałem z Politechniką Wrocławską (7 lat) oraz Uniwersytetem Stanforda (5 lat). Prezentowałem referaty na kilkunastu konferencjach naukowych, m.in. reprezentowałem Polskę na 18th European Young Statisticians Meeting. Publikowałem artykuły w najlepszych czasopismach naukowych (Genetics). Więcej szczegółów na moim profilu na LinkedIn.
Jak to działa?
Przed szkoleniem
Wybieracie konkretny program z moich propozycji lub piszecie, czego chcecie się nauczyć, a ja proponuję odpowiednie szkolenie. Ustalamy termin i miejsce: na uczelni lub zdalnie (zdecydowanie polecam szkolenia stacjonarne). Kilka dni przed szkoleniem przesyłam wszystkie materiały, z których będziemy korzystać. W przypadku szkoleń indywidualnych pracujesz głównie samemu, spotykamy się zdalnie co jakiś czas.
W trakcie
Szkolenie ma formę warsztatową: rozwiązujemy konkretne zadania i niejako "przy okazji" uczymy się wszystkiego. Część zadań robię ja, a część uczestnicy. W przypadku kursu indywidualnego zadania robisz samemu, a spotkania przeznaczamy na konkretne problemy.
Po szkoleniu
W udostępnionych materiałach dostajecie podsumowanie wszystkiego, o czym mówiliśmy na szkoleniu, dodatkowe zadania do rozwiązania "w domu", odpowiedzi do nich oraz artykuły pogłębiające dany temat. Wszystko tak opisane, by można było do tego wrócić za rok i zrozumieć. Oprócz tego proponuję konsultacje po właściwym szkoleniu, podczas których pomogę w konkretnych problemach uczestników (np. na danych, na których pracujecie).
Mój pomysł na szkolenia
W poniższym filmie opowiadam, jak wygląda mój pomysł na naukę, oraz pokazuję, na jakich materiałach będziemy pracować (zarówno w przypadku szkoleń dla grup, jak i indywidualnych).
Czego konkretnie uczę?
Poniżej dwa najważniejsze szkolenia w mojej ofercie. Pierwsze z podstaw obsługi R i analizy danych, choć przez „podstawy” rozumiem też zmianę kształtu danych (pivot, tabele przestawne), łączenie danych z kilku plików, jak również umiejętność tworzenia złożonych wykresów (jest to najważniejsze narzędzie statystyki!).
Dużym błędem w nauce języka R do celów naukowych jest przejście od razu do testów statystycznych. W praktyce używanie testów to najprostsze zadanie, a cała trudność tkwi w odpowiednim przygotowaniu danych. Wiele osób rezygnuje z nauki R, bo nie może poradzić sobie z tym etapem.
Drugie szkolenie jest już typowo statystyczne, choć niewiele ma wspólnego z dość nudnymi i niepraktycznymi kursami statystyki na uczelniach. Niektóre z tematów mogą wydawać się dość zaawansowane (np. testy permutacyjne i bootstrap), ale przekonacie się, że w rzeczywistości są prostsze od klasycznych testów statystycznych — oraz bardzo poszerzają horyzonty myślenia statystycznego.
Lista tematów, z jakich mogę zorganizować szkolenie, jest znacznie dłuższa (np. modele mieszane, GAM, uczenie maszynowe, aplikacje shiny). W praktyce najlepszą opcją może być szkolenie dedykowane — napiszcie, jakie tematy Was interesują.
Celem szkolenia jest nauka najważniejszej umiejętności w pracy z danymi: przekształcenia ich do takiej formy, która będzie bardziej przydatna w odpowiedzi na zadane pytania/hipotezy. Mimo że brzmi prosto, w praktyce jest to najtrudniejsze zadanie i nauce tych rzeczy trzeba poświęcić najwięcej czasu. Zobacz program.
Na szkoleniu dowiecie się, jak wykorzystać w praktyce najważniejsze miary i narzędzia statystyki: błąd standardowy, p-wartość, testy statystyczne, metoda bootstrap. Następnie przejdziemy do najpotężniejszego instrumentu, jakim dysponuje klasyczna statystyka: modelu regresji liniowej i logistycznej. Zobacz program.
Ile to kosztuje?
W przypadku szkoleń dla grup, koszt będę mógł podać, jak ustalimy jego zakres, liczbę uczestników, czas trwania itp. Napiszcie, to podam, jakie są opcje. Jeśli macie określony budżet, warto o tym wspomnieć — zaproponuję taki program szkolenia, żeby się w nim zmieścić.
Jeśli interesuje Cię szkolenie indywidualne, koszt to 2400 zł za szkolenie. W cenie jest 5 spotkań ze mną (45 minut każde). Pierwsze spotkanie najlepiej zrobić na samym początku, kolejne gdy napotkasz trudności, ewentualnie po zakończonym szkoleniu. Na takim spotkaniu mogę też pomóc w analizie Twoich danych.
Istotą szkoleń indywidualnych jest samodzielna nauka (to jedyny sposób, żeby nauczyć się programować) i materiały są tak zaprojektowane, że teoretycznie nie powinno być potrzebne żadne spotkanie. Jeśli obawiasz się, że taka forma może nie być dla Ciebie odpowiednia, możemy umówić się na jedno spotkanie (prześlę też materiały do pierwszej lekcji), koszt to 400 zł. Po przerobieniu całej lekcji, zdecydujesz, czy chcesz opłacić resztę (2000 zł).
Jeśli pracujesz na uczelni, spytaj w sekretariacie, czy nie ma przeznaczonych pieniędzy na dokształcanie pracowników.
Co wyróżnia moje szkolenia?
Na rynku istnieją inne firmy prowadzących szkolenia z R. Poniżej podaję kilka powodów, dlaczego warto skorzystać akurat z mojej oferty.
Przygotowanie dydaktyczne
Mam za sobą ponad 2500 godzin szkoleniowych, z czego połowa to indywidualne lekcje. Ponieważ na takich spotkaniach sam na sam łatwo o feedback, uważam, że wiem, jak przekazywać wiedzę (w jaki sposób mówić, jakie przykłady pokazać itd.), by druga osoba NAPRAWDĘ zrozumiała dany temat. Oprócz tego przez kilka lat prowadziłem zajęcia ze studentami na Politechnice Wrocławskiej.
Odpowiednie tempo
Nie pędzimy z materiałem, żeby poruszyć jak najwięcej tematów. Jeśli podstawy nie są zrozumiałe, zatrzymujemy się na nich dłużej, nawet kosztem tego, że nie zrealizujemy pewnych punktów (w razie czego znajdziecie je dobrze opisane w przesłanych materiałach).
Aktualizacja materiału
Szkolenia modyfikuję w trybie ciągłym. Rozwój R, ale też samego podejścia do statystyki i analizy danych jest tak szybki, że program szkolenia, który ma dwa lata, jest już przestarzały. Zwykle uaktualniam go co kilka miesięcy, dzięki czemu uczycie się tego, co w tym momencie jest uznawane za najlepsze.
Osobiste zaangażowanie
Za całe szkolenie jestem odpowiedzialny osobiście: umawiacie się ze mną, ja przygotowałem materiały, wszystkie spotkania są ze mną. Jestem bardzo zaangażowany w to, co robię, i zwyczajnie zależy mi, żeby każde szkolenie przeprowadzić najlepiej, jak się da.
Jak się skontaktować?
Jeśli chcecie, bym przeprowadził dla Was szkolenie z języka R, wypełnijcie formularz. A jeśli nie lubicie formularzy, napiszcie bezpośrednio na poniższy adres:
Wypełniając formularz swoimi danymi, zgadzasz się na ich przetwarzanie w celu kontaktu z Tobą na zasadach określonych w polityce prywatności.