Statisztikai szórás - Statistical dispersion

Példa két populációból származó mintákra, amelyek átlagos, de eltérő diszperzióval rendelkeznek. A kék populáció sokkal szétszórtabb, mint a vörös populáció.

A statisztikák , diszperziós (más néven változékonyság , szórás , vagy spread ) az, hogy milyen mértékben a forgalmazási megnyúlik vagy összenyomódik. A statisztikai szóródás mérésének gyakori példái a szórás , a szórás és az interkvartilis tartomány .

A diszperzió szemben áll a helyzettel vagy a központi tendenciával , és együttesen ezek az eloszlások leggyakrabban használt tulajdonságai.

Intézkedések

A statisztikai szórás mértéke egy nemnegatív valós szám , amely nulla, ha minden adat megegyezik, és növekszik, ahogy az adatok változatosabbá válnak.

A diszperziós mérések többsége ugyanazokkal az egységekkel rendelkezik, mint a mért mennyiség . Más szóval, ha a mérés méterben vagy másodpercben történik, akkor a szórás mértéke is. Példák a diszperziós intézkedésekre:

Ezeket gyakran használják (a léptéktényezőkkel együtt ) a skálaparaméterek becslőjeként , és ebben a kapacitásukban skálabecsléseknek nevezik őket . Erőteljes skálamérők azok, amelyeket nem befolyásol néhány kis kiugró érték , ideértve az IQR -t és a MAD -ot.

A statisztikai szóródás fenti méréseinek hasznos tulajdonsága az, hogy helyinvariánsak és lineárisak . Ez azt jelenti, hogy ha a valószínűségi változó X egy diszperziója S X akkor egy lineáris transzformáció Y  =  aX  +  b számára valós egy és b kell diszperziós S Y  = | a | S X , ahol | a | az abszolút értéke az egy , azaz figyelmen kívül hagyja a korábbi negatív előjellel - .

A szóródás egyéb mérései dimenziótlanok . Más szóval, akkor sem rendelkeznek egységekkel, ha maga a változó is rendelkezik egységekkel. Ezek tartalmazzák:

Vannak más mérési módszerek is:

A szóródás egyes intézkedéseinek speciális céljai vannak. Az Allan szórás olyan alkalmazásokhoz használható, ahol a zaj megzavarja a konvergenciát. A Hadamard -variancia használható a lineáris frekvenciaeltérés érzékenységének ellensúlyozására.

A kategorikus változók esetében ritkábban mérik a szórást egyetlen számmal; lásd a minőségi eltérést . Ennek egyik mércéje a diszkrét entrópia .

Források

A fizikai tudományokban az ilyen változékonyság véletlenszerű mérési hibákból adódhat: a műszeres mérések gyakran nem tökéletesen pontosak, azaz reprodukálhatók , és a mérési eredmények értelmezésében és jelentésében további értékkülönbség van . Feltételezhetjük, hogy a mért mennyiség stabil, és hogy a mérések közötti eltérés megfigyelési hibának köszönhető . A nagy részecskékből álló rendszert viszonylag kevés makroszkopikus mennyiség, például hőmérséklet, energia és sűrűség átlagos értékei jellemzik. A szórás az ingadozáselmélet fontos mérőszáma, amely sok fizikai jelenséget megmagyaráz, beleértve azt is, hogy miért kék az ég.

A biológiai tudományokban a mért mennyiség ritkán változatlan és stabil, és a megfigyelt eltérés ráadásul a jelenség velejárója is lehet: Ennek oka lehet az egyének közötti változékonyság , azaz a populáció egymástól eltérő tagjai. Ezenkívül az egyénen belüli variabilitásnak is köszönhető , azaz ugyanaz az alany különbözik a különböző időpontokban vagy más körülmények között végzett tesztek során. Az ilyen típusú változékonyság a gyártott termékek színterén is megfigyelhető; még az aprólékos tudós is talál variációt.

A közgazdaságtanban , a pénzügyekben és más tudományágakban a regresszióanalízis megpróbálja megmagyarázni egy függő változó szóródását, amelyet általában a varianciája alapján mérnek, egy vagy több független változó felhasználásával , amelyek mindegyike maga rendelkezik pozitív szórással. A megmagyarázott szórási töredéket determinációs együtthatónak nevezzük .

A diszperzió részleges rendezése

Az átlagmegőrző szórás (MPS) az A valószínűség-eloszlásról a másikra a B valószínűségi eloszlásról való változás, ahol B úgy alakul ki, hogy A valószínűségi sűrűségfüggvényének egy vagy több részét szétteríti, miközben az átlagot (a várt értéket) változatlanul hagyja. Az átlagmegőrző szórás fogalma a valószínűségi eloszlások részleges sorrendjét biztosítja a szórások szerint: két valószínűségi eloszlás közül az egyiket úgy lehet besorolni, hogy nagyobb diszperzióval rendelkezik, mint a másik, vagy alternatívaként egyik sem sorolható több szóródáshoz.

Lásd még

Hivatkozások