Danetyka to polskie tłumaczenie data science. Nie przyjęło się, ale moim zdaniem dobrze brzmi (jak matematyka).
Jeśli nie jesteś tu przypadkiem, wybierz z poniższej listy, co konkretnie Cię interesuje.
Konsultacje
Analiza danych, statystyka, uczenie maszynowe
Analizy statystyczne
Do artykułów naukowych,
na zlecenie
Szkolenia z języka R
Dla naukowców,
grupowe lub indywidualne
Czym jest nauka o danych?
Nauka o danych (data science, danetyka, danologia) to dziedzina, która zajmuje się badaniem danych w celu uzyskania z nich wiedzy (praktycznych wniosków). Z jednej strony nic nowego: czyż nie każda wiedza pochodzi z jakichś danych? W data science staramy się jednak wydobywać tę wiedzę w pewien ustrukturyzowany („naukowy”) sposób, bazując na danych w konkretnej formie (np. tabularycznej), korzystając z narzędzi programistycznych, metod statystycznych czy uczenia maszynowego.
Czy to jest łatwe? W tej pracy autorzy podsumowują wnioski, do jakich doszło 161 badaczy, którzy weryfikowali tę samą hipotezę na podstawie tych samych danych. I były to wnioski zupełnie rozbieżne: badany związek u części badaczy został uznany za pozytywny, u części za negatywny, a u części nie został potwierdzony.
We wspomnianej publikacji próbuje się znaleźć ogólne czynniki/podejścia, które wyjaśniają tę wariancję — i to się praktycznie nie udaje. Czyli za te rozbieżności odpowiadają indywidualne decyzje badaczy, których nie da się w jakiś sposób pogrupować, skodyfikować. Nie da się podać ogólnego przepisu na analizę danych.
Ale prawda jest jedna, czyż nie? A w takim razie: nie, analizowanie danych nie jest łatwe. I warto się tego cały czas uczyć, by podejmować lepsze decyzje — i ostatecznie wyciągać bliższe prawdy wnioski.