A valószínűségi függvény színátmenete
A statisztikákban a pontszám (vagy informátor ) a log-likelihood függvény gradiense a paramétervektor vonatkozásában . A paramétervektor egy adott pontján kiértékelve a pontszám a log-likelihood függvény meredekségét és ezáltal a paraméterértékek végtelen kicsi változásai iránti érzékenységet jelzi . Ha a log-likelihood függvény folyamatos a paraméterterületen , akkor a pontszám helyi maximumon vagy minimumon eltűnik ; ezt a tényt használják a maximális valószínűség becslésében, hogy megtalálják azokat a paraméterértékeket, amelyek maximalizálják a valószínűségi függvényt.
Mivel a pontszám függvénye a megfigyelések , hogy vannak kitéve mintavételi hiba , alkalmas arra, hogy egy vizsgálati statisztika ismert pontszám teszt , amelyben a paraméter tartott egy adott értéket. Ezenkívül két valószínűségi függvény két különböző paraméterértéken értékelt aránya a pontszámfüggvény határozott integráljának tekinthető.
Meghatározás
A pontszám a valószínűségfüggvény természetes logaritmusának gradiense ( részleges deriváltvektora ) , egy m -dimenziós paramétervektor vonatkozásában .
Így a differenciálás egy sorvektorot eredményez , és jelzi a valószínűség érzékenységét (származéka az értékével normalizálva).
A régebbi szakirodalomban a "lineáris pontszám" utalhat a pontszámra az adott sűrűség végtelen kis fordítása tekintetében. Ez a konvenció abból az időből származik, amikor az elsődleges érdeklődési paraméter az eloszlás átlaga vagy mediánja volt. Ebben az esetben a megfigyelés valószínűségét a forma sűrűsége adja . A "lineáris pontszám" ekkor a következőképpen van definiálva
Tulajdonságok
Átlagos
Bár az eredmény függvénye , ez attól is függ a megfigyelések , amelynél a likelihood függvény értékelik, és figyelembe véve a véletlen jellegű mintavétel egyik hozhat annak várható értéke felett minta helyet . Bizonyos szabályszerűségi feltételek mellett a véletlenszerű változók sűrűségfüggvényeinél a pontszám várható értéke a valódi paraméterértékkel értékelve nulla. Hogy ez átírni a likelihood függvény , mint egy valószínűségi sűrűségfüggvény , és jelöli a minta teret . Azután:
A feltételezett szabályszerűségi feltételek lehetővé teszik a derivált és az integrál felcserélését (lásd Leibniz integrálszabályát ), ezért a fenti kifejezés átírható
Érdemes szavakkal megismételni a fenti eredményt: a pontszám várható értéke nulla. Így, ha valaki ismételten mintát vesz valamilyen eloszlásból, és többször kiszámítja a pontszámot, akkor a pontszámok átlagértéke aszimptotikusan nullára csökken .
Variancia
A pontszám szórása ,, a fenti kifejezésből származtatható a várható értékre.
Ezért a pontszám szórása megegyezik a log-valószínűség hesseni mátrixának negatív várható értékével .
Ez utóbbit Fisher -információ néven ismerik és írják . Ne feledje, hogy a Fisher -információ nem egy konkrét megfigyelés függvénye, mivel a véletlen változót átlagolták. Ez az információfogalom hasznos, ha összehasonlítjuk egy véletlenszerű folyamat két megfigyelési módszerét .
Példák
Bernoulli folyamat
Fontolja meg egy Bernoulli -folyamat első n kísérletének megfigyelését , és látja, hogy A közülük sikerek, a többi B kudarc, ahol a siker valószínűsége θ .
Akkor a valószínűsége az
tehát a pontszám s az
Most ellenőrizhetjük, hogy a pontszámra vonatkozó elvárás nulla. Figyelembe véve, hogy a várható A jelentése nθ és a várakozás B jelentése N (1 - θ ) [visszahívás, hogy A és B jelentése valószínűségi változók], azt látjuk, hogy a várható s jelentése
Ellenőrizhetjük a szórását is . Tudjuk, hogy A + B = n (így B = N - A ), és varianciája A jelentése nθ (1 - θ ), így a varianciája s jelentése
Bináris eredménymodell
A bináris kimenetű modelleknél ( Y = 1 vagy 0) a modell pontozható a jóslatok logaritmusával
ahol p a becsült modell valószínűsége és S a pontszám.
Alkalmazások
Pontozási algoritmus
A pontozási algoritmus egy iteratív módszer a maximális valószínűség becslő számszerű meghatározására .
Pontszám teszt
Vegye figyelembe, hogy ez a megfigyelés és a függvény függvénye , így általában nem statisztika . Azonban bizonyos alkalmazásokban, például a pontozási tesztben , a pontszámot meghatározott értéken értékelik (például nullhipotézis érték), ebben az esetben az eredmény statisztika. Intuitív módon, ha a korlátozott becslő közel van a valószínűségi függvény maximumához, a pontszám nem térhet el nullától több mint mintavételi hibánál . 1948 -ban CR Rao először bebizonyította, hogy a pontszám négyzete osztva az információs mátrixszal aszimptotikus χ 2 -eloszlást követ a nullhipotézis alapján.
Továbbá vegye figyelembe, hogy a valószínűségi arány vizsgálatát a
ami azt jelenti, hogy a likelihood-ratio teszt az és közötti pontszámfüggvény alatti területként értelmezhető .
Lásd még
Megjegyzések
Hivatkozások