Co je abnormální?
Abnormality lze identifikovat graficky, vizuální kontrolou grafu dat. Mohou být také identifikovány numericky výpočtem míry statistické odchylky, jako je z-skóre nebo standardizované reziduum.
Přítomnost abnormalit v souboru dat může mít dopad na výsledky statistické analýzy a při provádění analýzy dat je důležité zvážit jejich potenciální dopad. V některých případech může být nutné abnormality před analýzou odstranit ze souboru dat, zatímco v jiných případech mohou být uchovány jako cenné informační body.
Zde je několik běžných příkladů abnormalit:
* V datové sadě výsledků studentských testů může být abnormálně vysoké skóre způsobeno podváděním, zatímco abnormálně nízké skóre může znamenat studenta, který nebyl na test připraven.
* V souboru údajů o prodejích může být abnormálně vysoký prodej způsoben speciální akcí nebo jednorázovým prodejem, zatímco abnormálně nízký prodej může naznačovat, že obchod má potíže.
* V sadě lékařských dat může abnormálně vysoká nebo nízká hodnota znamenat zdravotní stav, který vyžaduje další vyšetření.
Je důležité si uvědomit, že ne všechny abnormality jsou výsledkem chyb nebo neobvyklých pozorování. V některých případech mohou být abnormality způsobeny legitimními změnami v základní populaci. Například v datovém souboru cen akcií může být abnormálně vysoká cena způsobena pozitivní zprávou o zisku, zatímco abnormálně nízká cena může být způsobena špatnými zprávami.
Proto je důležité abnormality pečlivě prozkoumat, než uděláte jakékoli závěry o jejich významu.