Pontszám (statisztika) - Score (statistics)

A statisztikákban a pontszám (vagy informátor ) a log-likelihood függvény gradiense a paramétervektor vonatkozásában . A paramétervektor egy adott pontján kiértékelve a pontszám a log-likelihood függvény meredekségét és ezáltal a paraméterértékek végtelen kicsi változásai iránti érzékenységet jelzi . Ha a log-likelihood függvény folyamatos a paraméterterületen , akkor a pontszám helyi maximumon vagy minimumon eltűnik ; ezt a tényt használják a maximális valószínűség becslésében, hogy megtalálják azokat a paraméterértékeket, amelyek maximalizálják a valószínűségi függvényt.

Mivel a pontszám függvénye a megfigyelések , hogy vannak kitéve mintavételi hiba , alkalmas arra, hogy egy vizsgálati statisztika ismert pontszám teszt , amelyben a paraméter tartott egy adott értéket. Ezenkívül két valószínűségi függvény két különböző paraméterértéken értékelt aránya a pontszámfüggvény határozott integráljának tekinthető.

Meghatározás

A pontszám a valószínűségfüggvény természetes logaritmusának gradiense ( részleges deriváltvektora ) , egy m -dimenziós paramétervektor vonatkozásában .

Így a differenciálás egy sorvektorot eredményez , és jelzi a valószínűség érzékenységét (származéka az értékével normalizálva).

A régebbi szakirodalomban a "lineáris pontszám" utalhat a pontszámra az adott sűrűség végtelen kis fordítása tekintetében. Ez a konvenció abból az időből származik, amikor az elsődleges érdeklődési paraméter az eloszlás átlaga vagy mediánja volt. Ebben az esetben a megfigyelés valószínűségét a forma sűrűsége adja . A "lineáris pontszám" ekkor a következőképpen van definiálva

Tulajdonságok

Átlagos

Bár az eredmény függvénye , ez attól is függ a megfigyelések , amelynél a likelihood függvény értékelik, és figyelembe véve a véletlen jellegű mintavétel egyik hozhat annak várható értéke felett minta helyet . Bizonyos szabályszerűségi feltételek mellett a véletlenszerű változók sűrűségfüggvényeinél a pontszám várható értéke a valódi paraméterértékkel értékelve nulla. Hogy ez átírni a likelihood függvény , mint egy valószínűségi sűrűségfüggvény , és jelöli a minta teret . Azután:

A feltételezett szabályszerűségi feltételek lehetővé teszik a derivált és az integrál felcserélését (lásd Leibniz integrálszabályát ), ezért a fenti kifejezés átírható

Érdemes szavakkal megismételni a fenti eredményt: a pontszám várható értéke nulla. Így, ha valaki ismételten mintát vesz valamilyen eloszlásból, és többször kiszámítja a pontszámot, akkor a pontszámok átlagértéke aszimptotikusan nullára csökken .

Variancia

A pontszám szórása ,, a fenti kifejezésből származtatható a várható értékre.

Ezért a pontszám szórása megegyezik a log-valószínűség hesseni mátrixának negatív várható értékével .

Ez utóbbit Fisher -információ néven ismerik és írják . Ne feledje, hogy a Fisher -információ nem egy konkrét megfigyelés függvénye, mivel a véletlen változót átlagolták. Ez az információfogalom hasznos, ha összehasonlítjuk egy véletlenszerű folyamat két megfigyelési módszerét .

Példák

Bernoulli folyamat

Fontolja meg egy Bernoulli -folyamat első n kísérletének megfigyelését , és látja, hogy A közülük sikerek, a többi B kudarc, ahol a siker valószínűsége  θ .

Akkor a valószínűsége az

tehát a pontszám s az

Most ellenőrizhetjük, hogy a pontszámra vonatkozó elvárás nulla. Figyelembe véve, hogy a várható A jelentése és a várakozás B jelentése N (1 -  θ ) [visszahívás, hogy A és B jelentése valószínűségi változók], azt látjuk, hogy a várható s jelentése

Ellenőrizhetjük a szórását is . Tudjuk, hogy A + B = n (így BN  -  A ), és varianciája A jelentése (1 -  θ ), így a varianciája s jelentése

Bináris eredménymodell

A bináris kimenetű modelleknél ( Y = 1 vagy 0) a modell pontozható a jóslatok logaritmusával

ahol p a becsült modell valószínűsége és S a pontszám.

Alkalmazások

Pontozási algoritmus

A pontozási algoritmus egy iteratív módszer a maximális valószínűség becslő számszerű meghatározására .

Pontszám teszt

Vegye figyelembe, hogy ez a megfigyelés és a függvény függvénye , így általában nem statisztika . Azonban bizonyos alkalmazásokban, például a pontozási tesztben , a pontszámot meghatározott értéken értékelik (például nullhipotézis érték), ebben az esetben az eredmény statisztika. Intuitív módon, ha a korlátozott becslő közel van a valószínűségi függvény maximumához, a pontszám nem térhet el nullától több mint mintavételi hibánál . 1948 -ban CR Rao először bebizonyította, hogy a pontszám négyzete osztva az információs mátrixszal aszimptotikus χ 2 -eloszlást követ a nullhipotézis alapján.

Továbbá vegye figyelembe, hogy a valószínűségi arány vizsgálatát a

ami azt jelenti, hogy a likelihood-ratio teszt az és közötti pontszámfüggvény alatti területként értelmezhető .

Lásd még

Megjegyzések

Hivatkozások