Rozkład Cauchy’ego

  • Post author:

Jak byłem mały, wydawało mi się, że rozkład Cauchy’ego jest tylko po to, żeby Centralne Twierdzenie Graniczne nie zawsze działało. Jak już jestem większy, to wiem, że po pierwsze, jest to całkiem naturalny rozkład, po drugie, CTG działa zawsze, bo to przecież twierdzenie matematyczne.

Wylosujmy jakąś liczbę ze standardowego rozkładu normalnego, potem drugą i podzielmy je. Jeśli będziemy tak robić wielokrotnie, w końcu otrzymane wyniki zaczną się rozkładać zgodnie z rozkładem Cauchy’ego:

Czasem dostaniemy liczbę dodatnią, czasem ujemną. Jest tu pełna symetria: możemy otrzymać wartości z przedziału np. [1,2] i z takim samym prawdopodobieństwem z [-2,-1]. Policzmy teraz średnią z tych wyników. Kto zgadnie, ile nam wyszło?

Średnia i wartość oczekiwana

Jakiś początkujący statystyk mógłby odpowiedzieć, że średnia nie istnieje — ignorując fakt, że właśnie ją policzyliśmy. Jeszcze inny powie, że średnia powinna być bliska zeru, w końcu rozkład jest symetryczny wokół tej liczby. Też by się mylił, choć trudniej byłoby to wytłumaczyć. Ale spróbujmy.

Wyobraźmy sobie pana Adama, który bardzo się stara, żeby zarobić większe pieniądze. Póki co mniej więcej tak samo często zyskuje, jak i traci, przez co wychodzi na zero. To go frustruje, więc idzie w stronę bardzo ryzykownych interesów. Czasem zarobi na nich 100 tys. zł, ale zaraz potem straci milion. Zakładając, że może mieć dowolne długi, ile będzie miał na koncie za kilkanaście lat? Ewentualnie (bo pytamy o średnią), jaki będzie średni zarobek z pojedynczego interesu?

Ciężko tu cokolwiek mądrego powiedzieć, skoro w każdej chwili pan Adam może zarobić bardzo dużo, a potem stracić jeszcze więcej. Jednego dnia może być milionerem, a drugiego mieć milionowe długi — i to się w żaden sposób nie stabilizuje.

Ale czyż w rozkładzie Cauchy’ego nie ma symetrii? Czy jeśli pan Adam dziś zarobi milion, to za jakiś czas nie powinien stracić tego samego miliona i wyjść na zero? Nie, bo istnieje zbyt wysokie ryzyko, że to jednak będą dwa miliony.

Natomiast licząc medianę, w pewnym sensie ignorujemy wielkość tych liczb. Wystarczy nam fakt, że z takim samym prawdopodobieństwem pan Adam zarobi, jak i straci. A w takim razie mediana wynosi 0.

Rozkład natury

A teraz co do naturalności rozkładu Cauchy’ego, czy ogólniej: rozkładów o ciężkich ogonach. W pewnym sensie odpowiadają one sytuacjom, w których niespodziewane zdarzenie ma bardzo poważne konsekwencje. To dane odstające, których NIE DA się pominąć. Czarne łabędzie.

Wyobraźmy sobie, że możemy ze swojego życia wyeliminować jakieś zdarzenie i „puścić” to życie jeszcze raz, od tego momentu. Pewnie w większości przypadków niewiele to zmieni i dalej będziemy tym samymi ludźmi, którymi jesteśmy (z pewnym przybliżeniem). Ale najpewniej będą też takie (pojedyncze!), które nas definiują, bez których bylibyśmy zupełnie inni. Choć niekoniecznie potrafimy je wskazać.

Kącik matematyczny

Rozkład Cauchy’ego dostaniemy również, losując jedną liczbę z rozkładu jednostajnego na przedziale [-pi/2, pi/2] i licząc tangens (tzn. nie trzeba nic dzielić).

Matematycznie, nieistnienie wartości oczekiwanej wynika z tego, że jeśli przedział, na którym jest zdefiniowany rozkład, rozbijemy na część od minus nieskończoności do zera oraz od zera do nieskończoności, to całka na lewym jest równa minus nieskończoność, a na prawym plus nieskończoność.

To wcale nie jest oczywiste, że takie nieskończoności nie mogą się skrócić. W ciągu (n – n) też mamy nieskończoność minus nieskończoność, a granica jest równa 0. Problem w tym, że całka jest tak zdefiniowana, że do obu nieskończoności nie musimy poruszać się w tym samym tempie. Istnieje jednak coś takiego jak Cauchy principal value i licząc w ten sposób, dostaniemy 0.

Przykład na koniec (z życiem) to wiadomo, takie luźne skojarzenie. Wcale nie jestem przekonany, czy tak to działa, tzn. w odpowiednich proporcjach. Może np. takich pojedynczych ważnych zdarzeń jest bardzo dużo (i bliżej temu do chaosu). Ciekawe, czy są jakieś badania na ten temat. Eksperyment trudno przeprowadzić 😉


Jeśli moje teksty są dla Ciebie wartościowe, na podany niżej adres email mogę przesłać Ci wiadomość, gdy pojawią się nowe. Zapraszam też na mój kanał na youtube.