Przejdź do bloga

Kwestionowanie kultu dominującego rozkładu normalnego

O wszechobecności skośności w przyrodzie: kwestionowanie kultu dominującego rozkładu normalnego

W wielu kręgach panuje powszechne przekonanie, iż rozkład normalny jest najbardziej odpowiednim, praktycznie domyślnym przybliżeniem opisu świata. Gdy rozkład obserwowanych danych odbiega od normalności (lub przynajmniej od symetrii z jednym maksimum) wykazując skośność lub inne wzorce odbiegające od “krzywej dzwonowej”, nazbyt często uważa ten fakt za nienaturalny i trudny do zaakceptowania. Podejmuje się przeto próby ich “naprawy” przez wymuszoną symetryzację, polegającą na eliminacji całych zbiorów obserwacji postrzeganych jako “odstające”, lub desperacko pożąda większej ilości danych. Powszechnie spotykanym podejściem jest transformacja danych tak, aby te przynajmniej „wydawały się normalne”, zwłaszcza podczas parametrycznego testowania hipotez lub modelowania statystycznego. Działania te wynikają częściowo z błędnego przekonania, że oba rodzaje analiz w ogóle wymagają normalności (sprostujemy ten mit w następnym wpisie), a częściowo z ugruntowanego pragnienia by świat był “przyjemnie symetryczny”. Cóż, można zrozumieć owo pragnienie, ale czy na pewno świat jest wyłącznie taki?

Centralne twierdzenie graniczne (CTG; ang. CLT) przywoływane jest tu w roli argumentu eliminującego wszelkie wątpliwości, postulując, że przecież w rzeczywistości obserwujemy efekty zsumowania bądź uśrednienia efektów oddziaływania wielu różnych procesów, zatem w efekcie “krzywa dzwonowa musi być dominująca”. I chociaż jest to poprawne rozumowanie w wielu przypadkach, niektórzy pomijają kwestię odpowiednich założeń całej rodziny centralnych twierdzeń granicznych, warunkujących sensowność ich użycia w praktyce. Brak spełnienia owych założeń może prowadzić bądź do powolnej zbieżności (wg rozkładu) do rozkładu normalnego lub w ogóle braku takowej. Z rzadka wspomina się istnienie rozkładów „problematycznych” dla CTG, takich jak rozkład Cauchy’ego, Levy’ego, prawo potęgowe (Pareto), a jeśli już - to z “przymrużeniem oka”, twierdząc, iż są to rzadkie przypadki teoretyczne, bez większego znaczenia. Nic bardziej mylnego! Rozkłady te pełnią istotną rolę w opisie rzeczywistych zjawisk w licznych dziedzinach nauki.

Zapomina się również, że addytywny sposób oddziaływań różnych czynników nie jest przecież jedynym możliwym. Na przykład w biologii skośność powstaje w naturalny sposób poprzez „kaskady reakcji”, w których procesy metabolizmu i eliminacji można opisać w sposób multiplikatywny ze względu na współdziałanie enzymów i hormonów. Tutaj produkt jednej reakcji służy jako substrat dla innej lub jeden hormon aktywuje lub hamuje produkcję/uwalnianie innego hormonu (hormonów). Dlatego w farmakokinetyce na porządku dziennym obserwuje się rozkłady (silnie) skośne, powstałe w efekcie iloczynowego i mieszanego oddziaływania różnych procesów fizjologicznych. Poziomy różnych markerów biochemicznych, nawet jeśli rozkładają się w przybliżeniu normalnie w populacji osób zdrowych, mogą wykazywać skrajną skośność w populacji chorych pacjentów. Dla przykładu przywołajmy stężenie cholesterolu LDL u pacjentów z ciężką hipercholesterolemią lub poziom hormonu PSA u pacjentów onkologicznych (o zmienności z łatwością sięgającej siedem rzędów wielkości). Liczność występowania gatunków, równania wzrostu populacji czy procesów rozpadu to kolejne iloczynowe przykłady typowo skutkujące skośnymi rozkładami. W efekcie, obok „klasycznego” addytywnego, istnieje iloczynowe CTG, prowadzące do rozkładu log-normalnego. I nie ma żadnego powodu, by sądzić, iż różne procesy nie mogą oddziaływać łącznie w sposób… mieszany.

Istnieją dalsze argumenty świadczące na korzyść tezy, iż asumetria immanentną częścią rzeczywistości i nie sposób jej lekceważyć w naukowym opisie wielu zjawisk. Wspomnimy o systemach wieloagentowych i równaniach kinetycznych pierwszego rzędu w kontekście równania Fokkera-Plancka pozwalającego na wyprowadzenie rozkładu log-normalnego. Innym podstawowym źródłem rozkładu log-normalnego jest rosnąca entropia w procesach fizycznych. Są naukowcy, którzy uważają rozkład log-normalny jest wręcz „rozkładem naturalnym”. Skośność – nie tylko log-normalna – pochodzi również z prawa Benforda, analizy przeżycia (dobrze obrazującej twierdzenie o ekstremalnych wartościach Fishera-Tippetta-Gniedenki), analizy zmiennych naturalnie uciętych, mieszanin rozkładów i obecności poprawnych lecz ekstremalnych obserwacji.

Lista dziedzin nauki, w których „normalność jest zjawiskiem paranormalnym”, jest długa! W świetle tych rozważań przypisanie rozkładowi normalnemu dominującej roli w nauce zaprzecza rzeczywistości i przejawia postawę myślenia życzeniowego.

Zapraszamy do zapoznania się z całością artykułu (po angielsku) - https://www.2kmm.pl/blog/On-the-ubiquity-of-skewness-in-nature .

Fragment diagramu interaktywnego: http://www.math.wm.edu/~leemis/chart/UDR/about.html

Fragment diagramu interaktywnego: http://www.math.wm.edu/~leemis/chart/UDR/about.html

Udostępnij na: