Prediktív elemzés - Predictive analytics

A prediktív elemzés számos statisztikai technikát foglal magában az adatbányászatból , a prediktív modellezésből és a gépi tanulásból, amelyek elemzik a jelenlegi és történelmi tényeket, hogy előrejelzéseket készítsenek a jövőbeli vagy más módon ismeretlen eseményekről.

Az üzleti életben a prediktív modellek a történelmi és tranzakciós adatokban található mintákat használják fel a kockázatok és lehetőségek azonosítására. A modellek számos tényező közötti kapcsolatokat rögzítenek, hogy lehetővé tegyék az adott feltételekhez kapcsolódó kockázatok vagy lehetőségek felmérését, és irányítják a jelölt tranzakciók döntéshozatalát .

Ezeknek a technikai megközelítéseknek a meghatározó funkcionális hatása az, hogy a prediktív elemzés prediktív pontszámot (valószínűséget) biztosít minden egyes személy (ügyfél, alkalmazott, egészségügyi beteg, termékcikk, jármű, alkatrész, gép vagy más szervezeti egység) számára annak meghatározása, tájékoztatása érdekében , vagy befolyásolják a nagyszámú személyre kiterjedő szervezeti folyamatokat, például a marketingben, a hitelkockázat -felmérésben, a csalások felderítésében, a gyártásban, az egészségügyben és a kormányzati műveletekben, beleértve a bűnüldözést is.

A prediktív elemzést a biztosításmatematikai tudomány , a marketing , az üzleti menedzsment , a sport/ fantasy sport , a biztosítás , a rendőrség , a távközlés , a kiskereskedelem , az utazás , a mobilitás , az egészségügy , a gyermekvédelem , a gyógyszeripar , a kapacitástervezés , a közösségi hálózatok és más területeken használják.

Az egyik legismertebb alkalmazás a hitelminősítés , amelyet az üzleti menedzsment során használnak . A pontozási modellek feldolgozzák az ügyfél hiteltörténetét , hitelkérelmét , ügyféladatait stb. Annak érdekében, hogy rangsorolják az egyéneket annak valószínűsége szerint, hogy időben teljesítik a jövőbeni hitelkifizetéseket.

Meghatározás

A prediktív elemzés a statisztikák azon területe, amely az adatokból az adatok kinyerésével és a trendek és viselkedési minták előrejelzésével foglalkozik . A prediktív webes elemzés továbbfejlesztése kiszámítja a jövőbeni online események statisztikai valószínűségeit . A prediktív elemzési statisztikai technikák közé tartozik az adatmodellezés , a gépi tanulás , az AI , a mélytanulási algoritmusok és az adatbányászat . Gyakran az ismeretlen érdekes esemény a jövőre vonatkozik, de a prediktív elemzés bármilyen ismeretlen típusra alkalmazható, legyen az múlt, jelen vagy jövő. Például a gyanúsítottak azonosítása a bűncselekmény elkövetése után, vagy a hitelkártya -csalás, amikor előfordul. A prediktív elemzés lényege, hogy összefüggéseket rögzít a magyarázó változók és a múltbeli eseményekből származó előre jelzett változók között, és kihasználja azokat az ismeretlen kimenetel előrejelzésére. Fontos azonban megjegyezni, hogy az eredmények pontossága és használhatósága nagyban függ az adatelemzés szintjétől és a feltételezések minőségétől.

A prediktív elemzést gyakran úgy határozzák meg, mint a részletesebb részletességű előrejelzést, azaz prediktív pontszámok (valószínűségek) generálását az egyes szervezeti elemek számára. Ez megkülönbözteti az előrejelzéstől . Például: "Prediktív elemzés - Olyan technológia, amely tapasztalatokból (adatokból) tanul, hogy megjósolja az egyének jövőbeli viselkedését a jobb döntések meghozatala érdekében." A jövő ipari rendszereiben a prediktív elemzés értéke a lehetséges problémák előrejelzése és megelőzése lesz, hogy elérjék a nulla közeli bontást, és tovább integrálják az előíró elemzésbe a döntések optimalizálása érdekében.

Típusok

Általában a prediktív elemzés kifejezés a prediktív modellezést , az adatok "pontozását" prediktív modellekkel és az előrejelzést jelenti . Az emberek azonban egyre gyakrabban használják a kifejezést kapcsolódó analitikai tudományágakra, például leíró modellezésre és döntésmodellezésre vagy optimalizálásra. Ezek a tudományágak szigorú adatelemzést is magukban foglalnak, és széles körben használják az üzleti életben a szegmentáláshoz és a döntéshozatalhoz, de különböző céljaik vannak, és az ezek alapjául szolgáló statisztikai technikák eltérőek.

Prediktív modellek

A prediktív modellezés prediktív modelleket használ a minta egységének egyedi teljesítménye és az egység egy vagy több ismert attribútuma vagy jellemzője közötti kapcsolat elemzésére. A modell célja annak felmérése, hogy annak valószínűsége, hogy egy másik minta hasonló egysége megmutatja az adott teljesítményt. Ez a kategória számos területen magában foglalja a modelleket, például a marketinget, ahol finom adatmintákat keresnek az ügyfelek teljesítményével kapcsolatos kérdések megválaszolásához, vagy a csalások felderítési modelljeit. A prediktív modellek gyakran végeznek számításokat élő tranzakciók során, például egy adott ügyfél vagy tranzakció kockázatának vagy lehetőségének értékelése érdekében, hogy irányítsák a döntést. A számítási sebesség fejlődésével az egyes ügynökök modellező rendszerei alkalmassá váltak az emberi viselkedés vagy az adott ingerekre vagy forgatókönyvekre adott reakciók szimulálására.

A rendelkezésre álló, ismert tulajdonságokkal és ismert teljesítménnyel rendelkező mintaegységeket "edzésmintának" nevezzük. A többi mintában szereplő, ismert tulajdonságokkal rendelkező, de ismeretlen teljesítményű egységeket "[képzésen kívüli" minta "egységeknek nevezzük. A mintán kívüli egységek nem feltétlenül állnak kronológiai kapcsolatban a képzési mintaegységekkel. Például a képzési minta viktoriánus szerzők írásának irodalmi tulajdonságaiból állhat, ismert attribútummal, és a mintán kívüli egység lehet az újonnan talált ismeretlen szerzőségű írás; egy prediktív modell segíthet abban, hogy egy művet egy ismert szerzőnek tulajdonítsanak. Egy másik példa a vérfröccsenés elemzése a szimulált bűncselekményekben, ahol a mintán kívüli egység a bűncselekmény tényleges vérfröccsenési mintája. A mintán kívüli egység lehet az oktatási egységekkel egy időben, egy korábbi időpontból vagy egy későbbi időpontból.

Leíró modellek

A leíró modellek számszerűsítik az adatviszonyokat oly módon, hogy gyakran használják az ügyfelek vagy a potenciális ügyfelek csoportokba sorolására. Ellentétben a prediktív modellekkel, amelyek egyetlen vásárlói magatartás (például hitelkockázat) előrejelzésére összpontosítanak, a leíró modellek sok különböző kapcsolatot azonosítanak az ügyfelek vagy a termékek között. A leíró modellek nem rangsorolják a sorrendben lévő ügyfeleket annak valószínűsége alapján, hogy egy adott intézkedést megtegyenek, mint a prediktív modellek. Ehelyett leíró modellek használhatók például az ügyfelek termékpreferenciái és életszakaszai szerinti kategorizálására. A leíró modellező eszközök felhasználhatók további modellek kifejlesztésére, amelyek nagyszámú egyedi ügynököt szimulálhatnak és előrejelzéseket tehetnek.

Döntési modellek

A döntési modellek a döntés minden eleme - az ismert adatok (beleértve a prediktív modellek eredményeit), a döntés és a döntés előrejelzett eredményei - közötti kapcsolatot írják le annak érdekében, hogy megjósolják a sok változót érintő döntések eredményeit. Ezek a modellek használhatók az optimalizálás során, maximalizálva bizonyos eredményeket, míg másokat minimalizálva. A döntési modelleket általában olyan döntési logika vagy üzleti szabályrendszer kidolgozására használják, amely minden ügyfél vagy körülmény számára a kívánt műveletet eredményezi.

Alkalmazások

Bár a prediktív elemzés számos alkalmazásban használható, néhány példát vázolunk fel, ahol a prediktív elemzés pozitív hatást mutatott az elmúlt években.

Üzleti

Az analitikus ügyfélkapcsolat -kezelés (CRM) a prediktív elemzés gyakori kereskedelmi alkalmazása. A prediktív elemzés módszereit alkalmazzák az ügyfelek adataira, hogy holisztikus képet alkossanak az ügyfélről. A CRM prediktív elemzést alkalmaz a marketingkampányok, értékesítések és ügyfélszolgálatok alkalmazásaiban. Az analitikus CRM alkalmazható az ügyfelek teljes életciklusa során ( felvásárlás , kapcsolatteremtés , megtartás és visszanyerés).

A vállalati szervezetek gyakran gyűjtenek és tartanak fenn bőséges adatokat, például vevői nyilvántartásokat vagy értékesítési tranzakciókat. Ezekben az esetekben a prediktív elemzés segíthet elemezni az ügyfelek kiadásait, felhasználását és egyéb viselkedését, ami hatékony keresztértékesítéshez vagy további termékek értékesítéséhez vezeti a jelenlegi ügyfeleket.

A prediktív elemzések megfelelő alkalmazása proaktívabb és hatékonyabb megtartási stratégiákat eredményezhet. Az ügyfél korábbi szolgáltatáshasználatának, szolgáltatási teljesítményének, kiadásainak és egyéb viselkedési mintáinak gyakori vizsgálatával a prediktív modellek meg tudják határozni annak valószínűségét, hogy az ügyfél hamarosan felmondja a szolgáltatást. A magas észlelt értékű ajánlatokkal történő beavatkozás növelheti az ügyfél megtérülésének vagy megtartásának esélyét. A prediktív elemzés előre jelezheti a csendes kopást, az ügyfél viselkedését a használat lassú, de folyamatos csökkentése érdekében.

Gyermekvédelem

Egyes gyermekjóléti ügynökségek prediktív elemzést kezdtek használni a magas kockázatú esetek megjelölésére. Például a floridai Hillsborough megyében a gyermekjóléti ügynökség prediktív modellező eszközének használata megakadályozta a bántalmazással összefüggő gyermekhalálokat a célpopulációban.

Klinikai döntéstámogató rendszerek

A prediktív elemzések elsősorban az egészségügyben találták hasznosnak azt, hogy meghatározzák, hogy melyik páciens veszélyeztetett olyan állapotok kialakulására, mint a cukorbetegség, asztma vagy szívbetegség. Ezenkívül a kifinomult klinikai döntéstámogató rendszerek prediktív elemzést tartalmaznak az orvosi döntéshozatal támogatására.

A neurodegeneratív rendellenességek 2016 -os tanulmánya erőteljes példája a CDS platformnak a Parkinson -kór diagnosztizálására, nyomon követésére, előrejelzésére és előrehaladásának nyomon követésére .

Jogi döntések eredményeinek előrejelzése

A jogi döntések kimenetelének előrejelzése AI -programokkal történhet. Ezek a programok segédeszközként használhatók az iparág szakmái számára.

Portfólió, termék vagy gazdasági szintű előrejelzés

Gyakran az elemzés középpontjában nem a fogyasztó áll, hanem a termék, portfólió, cég, ipar vagy akár a gazdaság. Például egy kiskereskedőt érdekelhet a bolti szintű kereslet előrejelzése készletgazdálkodási célokra. Vagy a Szövetségi Tartalék Testületet érdekelheti a munkanélküliségi ráta előrejelzése a következő évre. Az ilyen típusú problémák megoldhatók prediktív elemzéssel idősoros technikákkal (lásd alább). Ezeket gépi tanulási módszerekkel is meg lehet oldani, amelyek az eredeti idősorokat jellemzővektor térré alakítják át, ahol a tanulási algoritmus előrejelző erejű mintákat talál.

Biztosítás

Sok vállalkozásnak el kell számolnia a kockázati kitettséggel különböző szolgáltatásai miatt, és meg kell határoznia a kockázat fedezéséhez szükséges költségeket. Prediktív elemzési segítségével elvállalja e mennyiségek előre az esélye a betegség, az alapértelmezett , csőd , stb prediktív elemzési lehet egyszerűsíteni a folyamatot ügyfélszerzés megjósolja jövőbeli kockázati viselkedését használó ügyfél alkalmazás szintű adatokat. A hitelminősítések formájában alkalmazott prediktív elemzések csökkentették a hitelek jóváhagyásához szükséges időt, különösen a jelzálogpiacon. A megfelelő prediktív elemzés megfelelő árazási döntésekhez vezethet, ami segíthet csökkenteni a nemteljesítés jövőbeli kockázatát.

A technológia és a nagy adat befolyásolja

A big data olyan adathalmazok gyűjteménye, amelyek olyan nagyok és összetettek, hogy kényelmetlenné válnak a hagyományos adatbázis -kezelő eszközök használatával. A nagy adatok mennyisége, változatossága és sebessége kihívások elé állította a rögzítést, tárolást, keresést, megosztást, elemzést és vizualizációt. A nagy adatforrások például a webnaplók , az RFID , az érzékelőadatok , a közösségi hálózatok , az internetes keresési indexelés, a hívásrészletek, a katonai megfigyelés, valamint a csillagászati, biogeokémiai, genomikai és légkörtudományi összetett adatok. A Big Data az informatikai szervezetek által kínált legtöbb prediktív elemzési szolgáltatás magja. A számítógépes hardverek technikai fejlődésének-gyorsabb CPU-k, olcsóbb memória és MPP- architektúrák-és az új technológiáknak, mint például a Hadoop , a MapReduce , valamint az adatbázison belüli és szöveges elemzésnek köszönhetően a nagy adatok feldolgozása, most már megvalósítható a gyűjtés, elemzés és bányászat hatalmas mennyiségű strukturált és strukturálatlan adat új betekintéshez. Lehetőség van prediktív algoritmusok futtatására is adatfolyamon. Ma a nagy adatok feltárása és a prediktív elemzések használata minden eddiginél több szervezet számára elérhető, és olyan új módszereket javasolnak, amelyek képesek kezelni az ilyen adatkészleteket.

Elemzési technikák

A prediktív elemzések elvégzéséhez használt megközelítések és technikák nagyjából regressziós és gépi tanulási technikákba sorolhatók.

Regressziós technikák

A regressziós modellek a prediktív analitika alappillérei. A középpontban egy matematikai egyenlet létrehozása áll, mint modell, amely a különböző vizsgált változók közötti kölcsönhatásokat ábrázolja. A helyzettől függően a modellek széles választéka alkalmazható a prediktív elemzések végrehajtása során. Néhányat az alábbiakban röviden tárgyalunk.

Lineáris regressziós modell

A lineáris regressziós modell előrejelzi a válaszváltozót az ismeretlen együtthatójú paraméterek lineáris függvényeként. Ezeket a paramétereket úgy állítjuk be, hogy az illeszkedés mértéke optimalizált legyen. A modell illesztésével kapcsolatos erőfeszítések nagy része a maradvány méretének minimalizálására összpontosít, valamint annak biztosítására, hogy az véletlenszerűen eloszlik a modell előrejelzéseihez képest.

A regresszió célja, hogy a modell paramétereit úgy válasszuk ki, hogy minimálisra csökkentsük a maradék négyzetek összegét. Ezt szokásos legkisebb négyzet (OLS) becslésnek nevezik .

Diszkrét választású modellek

A többszörös regressziót (fent) általában akkor használják, ha a válaszváltozó folyamatos és korlátlan tartományú. A válaszváltozó gyakran nem folyamatos, hanem diszkrét. Míg matematikailag lehetséges többszörös regressziót alkalmazni a diszkrét rendezett függő változókra, a többszörös lineáris regresszió elmélete mögött húzódó néhány feltételezés már nem állja meg a helyét, és vannak más technikák is, mint például a diszkrét választási modellek, amelyek jobban megfelelnek az ilyen típusú elemzéseknek. Ha a függő változó diszkrét, ezek közül a kiváló módszerek közül néhány a logisztikus regresszió , a multinomiális logit és a probit modellek. Logisztikai regressziós és probit modelleket használnak, ha a függő változó bináris .

Logisztikus regresszió

Osztályozási környezetben az eredmény valószínűségeinek megfigyelésekhez rendelése logisztikai modell (logikai modell) néven is megvalósítható, amely a bináris függő változóról szóló információt korlátlan folytonos változóvá alakítja, és szabályos többváltozós modellt becsül meg.

A Wald és valószínűségi arány tesztje segítségével tesztelheti a statisztikai jelentőségét minden együttható b a modellben (analóg a t-próbák használt OLS regressziós; lásd fent). Az osztályozási modell illeszkedési minőségét felmérő teszt a "helyesen megjósolt százalék".

Probit regresszió

A Probit modellek alternatívát kínálnak a logisztikai regresszióra a kategorikus függő változók modellezésére.

Multinomiális logisztikai regresszió

A bináris logit modell kiterjesztése olyan esetekre, amikor a függő változó több mint 2 kategóriát tartalmaz, a multinomiális logit modell . Ilyen esetekben az adatok két kategóriába való összeomlása lehet, hogy nincs értelme, vagy az adatok gazdagságának elvesztéséhez vezethet. A multinomiális logit modell a megfelelő technika ezekben az esetekben, különösen akkor, ha a függő változókategóriák nincsenek rendezve (például színek, mint a piros, kék, zöld). Egyes szerzők kiterjesztették a multinomiális regressziót a funkciók kiválasztására/fontossági módszerekre, például véletlenszerű multinomiális logitra .

Logit versus probit

A két regresszió általában hasonlóan viselkedik, kivéve, hogy a logisztikai eloszlás kissé laposabb. A logit és probit modellből kapott együtthatók általában közel vannak egymáshoz. Az esélyhányados azonban könnyebben értelmezhető a logit modellben.

A gyakorlati okok, amelyek miatt a probit modellt a logisztikai modell helyett választották, a következők lehetnek:

  • Erős meggyőződés, hogy a mögöttes eloszlás normális
  • A tényleges esemény nem bináris eredmény ( pl . Csődállapot), hanem aránya ( pl . A lakosság aránya a különböző adósságszinteken).

Idősoros modellek

Az idősoros modelleket a változók jövőbeli viselkedésének előrejelzésére vagy előrejelzésére használják. Ezek a modellek figyelembe veszik azt a tényt, hogy az idővel felvett adatpontoknak belső szerkezetük lehet (például automatikus korreláció, trend vagy szezonális ingadozás), amelyet figyelembe kell venni. Ennek eredményeképpen a standard regressziós technikák nem alkalmazhatók az idősorok adataira, és módszertant dolgoztak ki a sorozat trendjének, szezonális és ciklikus összetevőjének lebontására.

Az idősoros modellek becsülik a sztochasztikus komponenseket tartalmazó differenciálegyenleteket. E modellek két általánosan használt formája az autoregresszív modellek (AR) és a mozgóátlag (MA) modellek. A Box – Jenkins módszertan az AR és MA modelleket egyesítve állítja elő az ARMA (autoregresszív mozgóátlag) modellt, amely a helyhez kötött idősorok elemzésének alappillére. Az ARIMA-t (autoregresszív integrált mozgóátlag-modellek) viszont a nem stacionárius idősorok leírására használják.

Az utóbbi években az idősoros modellek kifinomultabbá váltak, és megpróbálják modellezni a feltételes heteroskedaszticitást. Ilyen modellek közé tartozik az ARCH ( autoregresszív feltételes heteroskedaszticitás ) modell és a GARCH (általánosított autoregresszív feltételes heteroskedaszticitás) modell, mindkettőt gyakran használják pénzügyi idősorokhoz.

Túlélési vagy időtartam elemzés

A túlélési elemzés egy másik név az esemény-idő elemzésre. Ezeket a technikákat elsősorban az orvosi és biológiai tudományokban fejlesztették ki, de széles körben használják a társadalomtudományokban, mint a közgazdaságtan, valamint a mérnöki tudomány.

A túlélési adatokra jellemző cenzúra és nem-normalitás nehézségeket okoz, amikor az adatokat hagyományos statisztikai modellek, például többszörös lineáris regresszió segítségével próbálják elemezni . A normál eloszlás , mivel szimmetrikus eloszlás, pozitív és negatív értékeket is felvehet, de az időtartam természeténél fogva nem lehet negatív, ezért a normálist nem lehet feltételezni az időtartam/túlélés adataival való foglalkozáskor.

Az időtartammodellek lehetnek paraméteres, nemparaméteres vagy félparaméteres. Néhány általánosan használt modell a Kaplan-Meier és a Cox arányos veszély modellje (nem paraméteres).

Osztályozási és regressziós fák (CART)

Az osztályozási és regressziós fák (CART) egy nem paraméteres döntési fa tanulási technika, amely osztályozási vagy regressziós fákat állít elő, attól függően, hogy a függő változó kategorikus vagy numerikus.

A döntési fákat a modellezési adatkészlet változóin alapuló szabályok gyűjteménye alkotja:

  • A változók értékein alapuló szabályokat úgy választjuk ki, hogy a legjobb felosztást kapjuk, hogy megkülönböztessük a megfigyeléseket a függő változó alapján
  • Miután kiválasztott egy szabályt, és egy csomópontot kettéoszt, ugyanazt a folyamatot alkalmazza minden "gyermek" csomópontra (azaz ez egy rekurzív eljárás)
  • A felosztás leáll, ha a CART nem észlel további nyereséget, vagy ha bizonyos előre beállított leállítási szabályok teljesülnek. (Alternatív megoldásként az adatokat a lehető legnagyobb mértékben feldarabolják, majd a fát később metszik .)

A fa minden ága egy terminális csomópontban végződik. Minden megfigyelés egy és pontosan egy terminális csomópontba esik, és minden terminálcsomópontot egyedi szabályok határoznak meg.

A prediktív elemzések nagyon népszerű módszere a véletlenszerű erdők .

Többváltozós adaptív regressziós spline -ok

A többváltozós adaptív regressziós spline (MARS) egy nem paraméteres technika, amely rugalmas modelleket épít fel darabos lineáris regressziók illesztésével .

A többváltozós és adaptív regressziós spline megközelítés szándékosan túltolja a modellt, majd aszalt szilvákat, hogy elérje az optimális modellt. Az algoritmus számítási szempontból nagyon intenzív, és a gyakorlatban az alapfüggvények számának felső határa van megadva.

Gépi tanulási technikák

A gépi tanulás számos fejlett statisztikai módszert tartalmaz a regresszióhoz és a besoroláshoz, és számos területen talál alkalmazást, beleértve az orvosi diagnosztikát , a hitelkártya -csalások felderítését, az arc- és beszédfelismerést és a tőzsdei elemzést .

Eszközök

Történelmileg a prediktív elemzőeszközök használata - valamint az általuk elért eredmények megértése - fejlett készségeket igényelt. A modern prediktív elemzőeszközök azonban már nem korlátozódnak az informatikai szakemberekre. Ahogy egyre több szervezet alkalmaz prediktív elemzést a döntéshozatali folyamatokban, és integrálja azt működésébe, a piacon elmozdulást hoznak létre az üzleti felhasználók felé, mint az információk elsődleges fogyasztói. Az üzleti felhasználók olyan eszközöket szeretnének, amelyeket önmagukban is használhatnak. A szállítók válaszul új szoftvert hoznak létre, amely megszünteti a matematikai bonyolultságot, felhasználóbarát grafikus felületeket biztosít és/vagy olyan rövidítéseket készít, amelyek például fel tudják ismerni a rendelkezésre álló adatokat, és megfelelő prediktív modellt javasolnak. A prediktív elemzőeszközök elég kifinomultak lettek ahhoz, hogy megfelelően mutassák be és bontsák fel az adatproblémákat, így minden adatértő információs dolgozó felhasználhatja őket az adatok elemzésére és az érdemi, hasznos eredmények lekérésére. A modern eszközök például egyszerű diagramok, grafikonok és pontszámok segítségével mutatják be a megállapításokat, amelyek jelzik a lehetséges eredmények valószínűségét.

A piacon számos eszköz áll rendelkezésre, amelyek segítenek a prediktív elemzések végrehajtásában. Ezek a nagyon csekély felhasználói bonyolultságot igénylőktől a szakértő szakemberek számára kifejlesztettekig terjednek. Az eszközök közötti különbség gyakran a testreszabás szintjében és a megengedett adatemelésben rejlik.

PMML

A prediktív modelljelölő nyelvet (PMML) javasolták a prediktív modellek szabványos nyelvének. Egy ilyen XML-alapú nyelv lehetőséget biztosít a különböző eszközöknek a prediktív modellek meghatározására és megosztására. A PMML 4.0 2009 júniusában jelent meg.

Kritika

Rengeteg szkeptikus van a számítógépek és az algoritmusok jövőt megjósló képességeiről, köztük Gary King , a Harvard Egyetem professzora és a Kvantitatív Társadalomtudományi Intézet igazgatója. Az embereket számtalan módon befolyásolja környezetük. Ahhoz, hogy tökéletesen megjósolhassuk, mit fognak tenni az emberek ezután, szükség van arra, hogy az összes befolyásos változót pontosan ismerjék és mérjék. "Az emberek környezete még gyorsabban változik, mint ők maguk. Az időjárástól az anyjukhoz való viszonyukig minden megváltoztathatja az emberek gondolkodását és cselekedeteit. Mindezek a változók kiszámíthatatlanok. Az, hogy milyen hatással lesznek egy személyre, még kevésbé kiszámítható. Ha ha holnap pontosan ugyanabba a helyzetbe kerülnek, akkor teljesen más döntést hozhatnak. Ez azt jelenti, hogy a statisztikai előrejelzés csak steril laboratóriumi körülmények között érvényes, ami hirtelen nem olyan hasznos, mint amilyennek korábban tűnt. "

Az Informatikai Rendszerek Kutatása és a MIS Quarterly 1990 és 2006 között 1072 dolgozatból álló tanulmányában mindössze 52 empirikus tanulmány kísérletezett előrejelző állításokkal, amelyek közül csak 7 végzett megfelelő prediktív modellezést vagy tesztelést.

Lásd még

Hivatkozások

További irodalom

  • Agresti, Alan (2002). Kategóriás adatelemzés . Hoboken: John Wiley és fiai. ISBN 0-471-36093-7.
  • Coggeshall, Stephen, Davies, John, Jones, Roger. és Schutzer, Daniel: "Intelligent Security Systems", Freedman, Roy S., Flein, Robert A. és Lederman, Jess, Editors (1995). Mesterséges intelligencia a tőkepiacokon . Chicago: Irwin. ISBN 1-55738-811-3.CS1 maint: több név: szerzői lista ( link )
  • L. Devroye; L. Györfi; G. Lugosi (1996). A mintafelismerés valószínűségi elmélete . New York: Springer-Verlag. ISBN 9781461207115.
  • Enders, Walter (2004). Alkalmazott idősoros ökonometria . Hoboken: John Wiley és fiai. ISBN 0-521-83919-X.
  • Greene, William (2012). Ökonometriai elemzés, 7. kiadás . London: Prentice Hall. ISBN 978-0-13-139538-1.
  • Guidère, Mathieu; Howard N, Sh. Argamon (2009). Gazdag nyelvi elemzés a terrorizmus elleni küzdelemhez . Berlin, London, New York: Springer-Verlag. ISBN 978-3-642-01140-5.
  • Mitchell, Tom (1997). Gépi tanulás . New York: McGraw-Hill. ISBN 0-07-042807-7.
  • Siegel, Eric (2016). Prediktív elemzés: A hatalom annak megjósolására, hogy ki fog kattintani, vásárolni, hazudni vagy meghalni . John Wiley. ISBN 978-1119145677.
  • Tukey, John (1977). Feltáró adatok elemzése . New York: Addison-Wesley. ISBN 0-201-07616-0.
  • Finlay, Steven (2014). Prediktív elemzés, adatbányászat és Big Data. Mítoszok, tévhitek és módszerek . Basingstoke: Palgrave Macmillan. ISBN 978-1-137-37927-6.
  • Coker, Frank (2014). Pulzus: A vállalkozás létfontosságú jeleinek megértése . Bellevue, WA: Ambient Light Publishing. ISBN 978-0-9893086-0-1.