Co je abnormální?

Ve statistice je abnormální, také nazývaná odlehlá hodnota, datový bod, který se výrazně liší od ostatních datových bodů v datové sadě. Abnormální hodnoty mohou znamenat řadu věcí, včetně chyb měření, chyb při zadávání dat nebo přítomnosti neobvyklých pozorování, která nemusí být reprezentativní pro celkovou populaci.

Abnormality lze identifikovat graficky, vizuální kontrolou grafu dat. Mohou být také identifikovány numericky výpočtem míry statistické odchylky, jako je z-skóre nebo standardizované reziduum.

Přítomnost abnormalit v souboru dat může mít dopad na výsledky statistické analýzy a při provádění analýzy dat je důležité zvážit jejich potenciální dopad. V některých případech může být nutné abnormality před analýzou odstranit ze souboru dat, zatímco v jiných případech mohou být uchovány jako cenné informační body.

Zde je několik běžných příkladů abnormalit:

* V datové sadě výsledků studentských testů může být abnormálně vysoké skóre způsobeno podváděním, zatímco abnormálně nízké skóre může znamenat studenta, který nebyl na test připraven.

* V souboru údajů o prodejích může být abnormálně vysoký prodej způsoben speciální akcí nebo jednorázovým prodejem, zatímco abnormálně nízký prodej může naznačovat, že obchod má potíže.

* V sadě lékařských dat může abnormálně vysoká nebo nízká hodnota znamenat zdravotní stav, který vyžaduje další vyšetření.

Je důležité si uvědomit, že ne všechny abnormality jsou výsledkem chyb nebo neobvyklých pozorování. V některých případech mohou být abnormality způsobeny legitimními změnami v základní populaci. Například v datovém souboru cen akcií může být abnormálně vysoká cena způsobena pozitivní zprávou o zisku, zatímco abnormálně nízká cena může být způsobena špatnými zprávami.

Proto je důležité abnormality pečlivě prozkoumat, než uděláte jakékoli závěry o jejich významu.