Matematyka w data science

  • Wymagania. Nie zakładam żadnej wstępnej wiedzy z matematyki. Przyda się praktyka w data science.
  • Czas. Spotykamy się tak długo, jak uznasz, że jest to dla Ciebie wartościowe.
  • Koszt. 240 zł za spotkanie (45 minut).
matematyka i statystyka data science

Jeśli przeglądasz program tego szkolenia, najprawdopodobniej nie muszę przekonywać Cię o tym, że warto znać matematykę. Jeśli używamy jakichś narzędzi na wyższym poziomie, w końcu dochodzimy do etapu, że potrzebna nam jest wiedza, jak to narzędzie działa „od środka”. Data science jest „zbudowane z matematyki”.

Oprócz tego znajomość wyższej matematyki przydaje się bardziej bezpośrednio, gdy próbujemy zrozumieć publikację naukową z dziedziny analizy danych czy uczenia maszynowego. Będzie ona zapisana w języku matematyki, bo jest to optymalny język do takich zastosowań. A niestety jest on trudny, bo przy pomocy jednego symbolu da się zapisać mnóstwo treści.

Zaletą znajomości matematyki jest też to, że dzięki niej jesteśmy w stanie myśleć bardziej abstrakcyjnie o używanych narzędziach, widzieć więcej połączeń między nimi. Łatwiej jest zdecydować, które narzędzie jest najlepsze do danego problemu. Także ostatecznie staniemy się po prostu lepszymi praktykami.

Czego się nauczysz?

Na kursie nauczysz się najważniejszych tematów z analizy matematycznej i algebry, które są niezbędne do zrozumienia fundamentów data science. Mimo że poniżej jest wypisany bardziej szczegółowy program, na dodatek w pewnej kolejności, to kurs prowadzę w taki sposób, że dość często „przeskakujemy” między tematami. Wynika to po pierwsze z tego, że zwykle każdy już coś wie na dany temat. Po drugie, tu wcale nie o to chodzi, że trzeba znać wzory na pochodne, czy umieć policzyć konkretną całkę — ale by dobrze rozumieć idee, który stoją za tymi koncepcjami.

Co ważne, przy omawianiu każdego z zagadnień będę pokazywał, do czego się ono odnosi w kontekście data science. Na przykład nie tylko pokażę, jak odwracać macierze, ale jak tę wiedzę wykorzystać, by znaleźć współczynniki w regresji. Zamiast liczyć całkę z jakiejś losowo wybranej funkcji, policzymy przy jej pomocy prawdopodobieństwo, że zmienna losowa przyjmuje wartości z pewnego przedziału.

Jeśli musisz nauczyć się czegoś, co wykracza poza poniższy program, napisz — być może będę w stanie pomóc.

Program

1. Granice

- Ciągi i funkcje
- Nieskończoność to symbol
- Symbole nieoznaczone
- Liczba "e" i logarytm naturalny
- Tempo dążenia do nieskończoności

2. Pochodne

- Analiza zmienności funkcji, prędkość i przyspieszenie
- Problemy optymalizacyjne, maksima i minima

- Pochodna cząstkowa
- Reguła łańcucha (chain rule)
- Gradient

3. Szeregi nieskończone i całki

- Zbieżność i rozbieżność
- Ile jest liczba naturalnych, a ile rzeczywistych
- Pole powierzchni
- Wartość oczekiwana jako całka

4. Wektory i odległości

- Iloczyn skalarny, prostopadłość
- Liniowa zależność
- Normy L1 i L2
- Metryka euklidesowa i inne

5. Macierze

- Mnożenie, wyznacznik, liniowa niezależność, macierz odwrotna
- Rozkład SVD

- Wartości i wektory własne, PCA
- Za
stosowanie rachunku macierzowego w regresji