Oki következtetés - Causal inference

Az ok -okozati következtetés az a folyamat, amely meghatározza egy adott jelenség független, tényleges hatását, amely egy nagyobb rendszer része. A fő különbség az ok -okozati következtetés és az asszociációs következtetés között az, hogy az ok -okozati következtetés egy hatásváltozó válaszát elemzi, amikor a hatásváltozó oka megváltozik. A dolgok előfordulásának tudományát etiológiának nevezik . Az oksági következtetés azt állítja, hogy az oksági érvelés által az oksági érvelés által elméletbe hozott bizonyítékokat szolgáltatja .

Az ok -okozati következtetést minden tudomány széles körben tanulmányozza. Az ok -okozati összefüggések meghatározására szolgáló módszertan kifejlesztésében és megvalósításában számos újítás terjedt el az elmúlt évtizedekben. Az ok -okozati következtetés különösen nehéz marad ott, ahol a kísérletezés nehéz vagy lehetetlen, ami a legtöbb tudományban általános.

Az ok -okozati következtetések megközelítései széles körben alkalmazhatók minden típusú tudományos diszciplínában, és számos ok -okozati következtetési módszer, amelyet bizonyos tudományágak számára terveztek, más tudományágakban is hasznosnak bizonyult. Ez a cikk az oksági következtetés mögött meghúzódó alapvető folyamatot vázolja fel, és részletezi a különböző tudományágakban alkalmazott, hagyományosabb teszteket; ezt azonban nem szabad összetéveszteni azzal a javaslattal, hogy ezek a módszerek csak azokra a tudományágakra vonatkoznak, pusztán arra, hogy az adott tudományágban leggyakrabban használják őket.

Az ok -okozati következtetéseket nehéz végrehajtani, és a tudósok között jelentős vita folyik az okozati összefüggés helyes meghatározásának módjáról. Egyéb újítások ellenére továbbra is aggodalmak merülnek fel a tudósok által a korrelációs eredmények ok -okozati hibás hozzárendelésével, a tudósok által helytelen módszerek alkalmazásával, valamint a tudósok szándékos manipulációjával az elemzési eredmények alapján, hogy statisztikailag szignifikáns becsléseket kapjanak. Különös aggodalomra ad okot a regressziós modellek, különösen a lineáris regressziós modellek alkalmazása.

Meghatározás

Valaminek az okára hivatkozva a következőket írták le:

  • "... ok arra a következtetésre, hogy valami másnak az oka, vagy valószínűleg az lesz."
  • "A jelenség okának vagy okainak azonosítása, az ok és okozat kovariációjának megállapításával, időrendi viszonyban a hatást megelőző okokkal, és a valószínű alternatív okok megszüntetése."

Módszertan

Tábornok

Az ok -okozati következtetést olyan rendszerek tanulmányozásán keresztül végzik, ahol az egyik változó mértéke gyaníthatóan befolyásolja a másik mértékét. Az ok -okozati következtetéseket a tudományos módszerrel kapcsolatban végzik . Az ok -okozati következtetés első lépése egy hamisítható nullhipotézis megfogalmazása , amelyet később statisztikai módszerekkel tesztelnek . A gyakori statisztikai következtetések statisztikai módszerek segítségével határozzák meg annak valószínűségét, hogy az adatok véletlenül a nullhipotézis alatt fordulnak elő: Bayes -féle következtetést használunk egy független változó hatásának meghatározására. Általában statisztikai következtetéseket használnak az eredeti adatok véletlenszerű eltérései vagy egy jól meghatározott okozati mechanizmus hatása közötti különbség meghatározására. Nevezetesen, a korreláció nem jelent ok -okozati összefüggést , ezért az ok -okozati összefüggések tanulmányozása ugyanúgy foglalkozik a lehetséges ok -okozati mechanizmusok vizsgálatával, mint az adatok közötti eltérésekkel. Az ok -okozati következtetések gyakran keresett standardja egy olyan kísérlet, amelyben a kezelést véletlenszerűen osztják ki, de minden egyéb zavaró tényezőt állandó értéken tartanak. Az ok -okozati következtetésre irányuló erőfeszítések nagy része a kísérleti körülmények megismétlésére irányul.

Az epidemiológiai vizsgálatok különböző járványügyi módszereket alkalmaznak a kockázati tényezőkre és hatásokra vonatkozó bizonyítékok összegyűjtésére és mérésére, valamint a kettő közötti kapcsolat mérésének különböző módjait. Az ok -okozati következtetés módszereinek 2020 -as felülvizsgálatának eredményei azt találták, hogy a meglévő irodalom felhasználása a klinikai képzési programokhoz kihívást jelenthet. Ennek oka az, hogy a publikált cikkek gyakran fejlett technikai hátteret feltételeznek, több statisztikai, járványügyi, számítástechnikai vagy filozófiai szempontból íródhatnak, a módszertani megközelítések továbbra is gyorsan bővülnek, és az ok -okozati következtetés számos aspektusa korlátozottan terjed ki.

Az oksági következtetés általános keretei a szerkezeti egyenlet modellezés és a Rubin -kauzális modell .

Kísérleti

Az ok -okozati mechanizmusok kísérleti igazolása kísérleti módszerekkel lehetséges. A kísérlet fő motivációja az, hogy más kísérleti változókat állandóan tartson, miközben célirányosan manipulálja az érdeklődő változót. Ha a kísérlet statisztikailag szignifikáns hatásokat eredményez, mivel csak a kezelési változót manipulálják, akkor megalapozott a feltételezés, hogy az ok -okozati hatás hozzárendelhető a kezelési változóhoz, feltéve, hogy a kísérleti tervezésre vonatkozó egyéb szabványok teljesültek.

Kvázi kísérleti

Az ok-okozati mechanizmusok kvázi kísérleti ellenőrzésére akkor kerül sor, ha a hagyományos kísérleti módszerek nem állnak rendelkezésre. Ennek oka lehet a kísérlet lefolytatásának megfizethetetlen költsége vagy a kísérlet eredendő lehetetlensége, különösen a nagy rendszerekkel, például a választási rendszerek gazdaságosságával kapcsolatos kísérletek, vagy a kútra veszélyt jelentő kezelések. -a vizsgálati alanyok létére. Kvázi kísérletekre is sor kerülhet, ahol az információkat jogi okokból visszatartják.

Megközelítések az epidemiológiában

Az epidemiológia tanulmányozza az élőlények meghatározott populációinak egészségi és betegségi mintáit, hogy megállapítsa az okokat és a következményeket. A feltételezett kockázati tényezőnek való kitettség és a betegség közötti összefüggés utalhat az ok -okozati összefüggésre , de nem egyenértékű vele, mivel a korreláció nem jelent ok -okozati összefüggést . Történelmileg Koch posztulátumait a 19. század óta használták annak eldöntésére, hogy egy mikroorganizmus okozta -e a betegséget. A 20. században az 1965 -ben leírt Bradford Hill -kritériumokat használták a mikrobiológián kívüli változók ok -okozati összefüggéseinek felmérésére, bár még ezek a kritériumok sem kizárólagos módszerek az okozati összefüggések meghatározására.

A molekuláris epidemiológiában a vizsgált jelenségek molekuláris biológiai szinten vannak, beleértve a genetikát is, ahol a biomarkerek az ok vagy a hatás bizonyítékai.

A legújabb tendencia az, hogy bizonyítékokat találnak az expozíciónak a beteg szövetekben vagy sejtekben a molekuláris patológiára gyakorolt ​​hatására, a molekuláris patológiás epidemiológia (MPE) feltörekvő interdiszciplináris területén . Az expozíciónak a betegség molekuláris patológiás aláírásaival való összekapcsolása segíthet az okozati összefüggések felmérésében. Figyelembe véve egy adott betegség heterogenitásának természetét , az egyedi betegség elve, a betegség fenotipizálása és altípusa az orvosbiológiai és közegészségügyi tudományok irányzatai , amelyek személyre szabott orvoslásként és precíziós orvoslásként szerepelnek .

Megközelítések az informatikában

Az ok és okozat meghatározását két, egymástól független, változó, például X és Y változó megfigyelési adatai alapján végeztük, aszimmetria segítségével, bizonyos modellek bizonyítékai között az X → Y és Y → X irányban. Az elsődleges megközelítések algoritmuson alapulnak információelméleti modellek és zajmodellek.

Zajos modellek

Függesszen be egy független zajkifejezést a modellbe, hogy összehasonlítsa a két irány bizonyítékait.

Íme néhány zajmodell az Y → X hipotézishez az E zajjal:

  • Additív zaj:
  • Lineáris zaj:
  • Post-nemlineáris:
  • Heteroszkedasztikus zaj:
  • Funkcionális zaj:

Általános feltételezés ezekben a modellekben:

  • Nincs más oka Y -nak.
  • X és E nincs közös oka.
  • Az ok megoszlása ​​független az okozati mechanizmusoktól.

Intuitív szinten az elképzelés az, hogy a P (ok, okozat) együttes eloszlás P -be (ok)*ok (ok)*P (hatás | ok) faktorizálása általában kisebb komplexitású modelleket eredményez, mint a P (hatás)*P (Ok | Hatás). Bár a "komplexitás" fogalma intuitív módon vonzó, nem egyértelmű, hogyan kell pontosan meghatározni. Egy másik módszercsalád megpróbálja felfedezni az ok -okozati "lábnyomokat" nagy mennyiségű címkézett adatból, és lehetővé teszi a rugalmasabb ok -okozati összefüggések előrejelzését.

Megközelítések a társadalomtudományokban

Társadalomtudomány

A társadalomtudományok általában egyre inkább elmozdultak az ok -okozati összefüggések értékelésének mennyiségi keretei közé. Ennek nagy részét a társadalomtudományi módszertan szigorúbbá tételének eszközeként írták le. A politológiát jelentősen befolyásolta Gary King, Robert Keohane és Sidney Verba 1994 -ben megjelent Designing Social Inquiry kiadványa . King, Keohane és Verba azt javasolják, hogy a kutatók mind mennyiségi, mind minőségi módszereket alkalmazzanak, és alkalmazzák a statisztikai következtetés nyelvét. legyen világosabb az érdeklődési körükben és az elemzési egységekben. A kvantitatív módszerek hívei is egyre gyakrabban fogadták el az esetleges eredmények keretét , amelyet Donald Rubin dolgozott ki az ok -okozati összefüggés standardjaként.

Míg a lehetséges eredmények keretében továbbra is nagy hangsúlyt fektetnek a statisztikai következtetésre, a társadalomtudományi módszertanárok új eszközöket fejlesztettek ki az ok -okozati következtetés lefolytatására mind minőségi, mind mennyiségi módszerekkel, amelyeket néha "vegyes módszerek" -nek is neveznek. A különböző módszertani megközelítések hívei azt állítják, hogy a különböző módszerek jobban megfelelnek a különböző tanulmányi tárgyaknak. Herbert Smith szociológus, valamint James Mahoney és Gary Goertz politológusok idézték Paul Holland statisztikus, az 1986 -os "Statistics and Causal Inference" cikk szerzőjének megfigyelését, miszerint a statisztikai következtetés a legalkalmasabb az "okok hatásainak" felmérésére, nem pedig a "hatások okai". A kvalitatív módszertanosok azzal érveltek, hogy az okság formalizált modelljei, beleértve a folyamatkövetést és a homályos halmazelméletet, lehetőséget biztosítanak az ok -okozati összefüggésekre az esettanulmányokon belüli kritikus tényezők azonosításával vagy több esettanulmány összehasonlításával. Ezek a módszerek értékesek azoknál az alanyoknál is, ahol a potenciális megfigyelések korlátozott száma vagy a zavaró változók jelenléte korlátozná a statisztikai következtetések alkalmazhatóságát.

Közgazdaságtan és politológia

A közgazdaságtudományokban és a politikatudományokban az ok-okozati következtetés gyakran nehéz, a gazdasági és politikai realitások valós világbeli összetettsége, valamint sok nagyszabású jelenség kontrollált kísérleteken belüli képtelensége miatt. Az ok -okozati következtetések a gazdaság- és politikatudományokban továbbra is javulnak a módszertanban és a szigorban, köszönhetően a társadalomtudósok rendelkezésére álló technológia magasabb szintjének, a társadalomtudósok és a kutatások számának növekedésének, valamint az ok -okozati következtetési módszerek fejlesztésének a társadalomtudományok területén.

Annak ellenére, hogy a gazdasági rendszerekben az ok -okozati összefüggések meghatározása nehézségekbe ütközik, számos széles körben alkalmazott módszer létezik ezeken a területeken.

Elméleti módszerek

A közgazdászok és politológusok az elmélet (gyakran elméletvezérelt ökonometriában tanulmányozott) segítségével megbecsülhetik az állítólagos ok-okozati összefüggések nagyságát azokban az esetekben, amikor úgy vélik, hogy okozati összefüggés létezik. A teoretikusok feltételezhetnek egy okságinak hitt mechanizmust, és leírhatják a hatásokat adatelemzéssel, hogy igazolják javasolt elméletüket. Például az elméletírók a logika segítségével építhetnek fel egy modellt, például teoretizálhatják, hogy az eső ingadozásokat okoz a gazdasági termelékenységben, de ez fordítva nem igaz. Mindazonáltal a pusztán elméleti állítások alkalmazását, amelyek semmilyen prediktív felismerést nem kínálnak, "tudomány előtti" -nek nevezték, mert nincs képesség megjósolni a feltételezett okozati tulajdonságok hatását. Érdemes megismételni, hogy a társadalomtudomány regresszióanalízise nem magában foglalja az ok -okozati összefüggést, mivel sok jelenség rövid távon vagy bizonyos adathalmazokban korrelálhat, de nem mutat összefüggést más időszakokban vagy más adatkészletekben. Így az okozati összefüggés korrelációs tulajdonságokhoz való hozzárendelése korai, ha nincs jól meghatározott és indokolt oksági mechanizmus.

Instrumentális változók

Az instrumentális változók (IV) technika az ok -okozati összefüggések meghatározásának módszere, amely magában foglalja a modell egyik magyarázó változója és a modell hibaterméke közötti összefüggés megszüntetését. A hiedelem az, hogy ha egy modell hibakifejezése együtt jár egy másik változó variációjával, akkor a modell hibaterméke valószínűleg a magyarázó változó változásának hatása. Ennek az összefüggésnek a kiküszöbölése egy új instrumentális változó bevezetésével csökkenti a modell egészében előforduló hibát.

Modell specifikáció

A modellspecifikáció az adatok elemzéséhez használandó modell kiválasztásának művelete. A társadalomtudósoknak (és valójában minden tudósnak) meg kell határozniuk a megfelelő modellt, amelyet használni kell, mert a különböző modellek jól tudják becsülni a különböző kapcsolatokat.

A modellspecifikáció hasznos lehet a lassan felbukkanó ok -okozati összefüggések meghatározásában, ahol egy cselekvés hatása egy időszakban csak egy későbbi időszakban érezhető. Érdemes megjegyezni, hogy a korrelációk csak azt mérik, hogy két változónak van -e hasonló varianciája, nem pedig azt, hogy bizonyos irányban befolyásolják -e egymást; így nem lehet csak az összefüggések alapján meghatározni az ok -okozati összefüggés irányát. Mivel az ok -okozati cselekmények feltételezhetően megelőzik az okozati hatásokat, a társadalomtudósok olyan modellt használhatnak, amely kifejezetten az egyik változó másikra gyakorolt ​​hatását keresi egy bizonyos időtartamon belül. Ez ahhoz vezet, hogy a korábban bekövetkezett jelenségeket reprezentáló változókat kezelési hatásokként kell használni, ahol ökonometriai teszteket használnak az ilyen kezelési hatásoknak tulajdonított adatok későbbi változásainak megkeresésére, ahol az eredmények jelentős különbséget mutatnak a kezelési hatások jelentős különbsége után az okozati összefüggést jelezheti a kezelési hatások és a mért hatások között (pl. Granger-okozati vizsgálatok). Az ilyen tanulmányok példák az idősoros elemzésre .

Érzékenységvizsgálat

Más változók vagy regressziós elemzők a regresszióanalízisben szerepelnek vagy nem szerepelnek ugyanazon modell különböző megvalósításaiban annak biztosítása érdekében, hogy a különböző variációs forrásokat jobban el lehessen vizsgálni egymástól. Ez egyfajta érzékenységi elemzés: azt vizsgálja, hogy egy modell megvalósítása mennyire érzékeny egy vagy több új változó hozzáadására.

Az érzékenység -analízis fő motiváló aggálya a zavaró változók felfedezése . A zavaró változók olyan változók, amelyek nagy hatással vannak egy statisztikai teszt eredményére, de nem azok a változók, amelyeket az ok -okozati következtetés vizsgálni próbál. A zavaró változók azt eredményezhetik, hogy a regresszor jelentősnek tűnik az egyik megvalósításban, a másikban viszont nem.

Multikollinearitás

Az érzékenységi elemzés használatának másik oka a multikollinearitás kimutatása . A multikollinearitás az a jelenség, ahol két változó közötti korreláció nagyon magas. A két változó közötti magas korreláció drámai módon befolyásolhatja a statisztikai elemzés eredményét, ahol a nagyon korrelált adatok kis eltérései megváltoztathatják a változó hatását pozitív irányból negatív irányba, vagy fordítva. Ez a varianciavizsgálat velejárója. A multikollinearitás meghatározása hasznos az érzékenység elemzésében, mivel a nagymértékben korrelált változók különböző modell implementációkban történő kiküszöbölése megakadályozhatja az eredmények drámai változásait, amelyek az ilyen változók felvételéből adódnak.

Vannak azonban korlátok az érzékenységi elemzés azon képességére, hogy megakadályozzák a multikollinearitás káros hatásait, különösen a társadalomtudományokban, ahol a rendszerek bonyolultak. Mivel elméletileg lehetetlen minden zavaró tényezőt kellően összetett rendszerbe foglalni vagy mérni, az ökonometriai modellek hajlamosak a közös okok tévedésére, ahol az ok-okozati hatásokat helytelenül a rossz változóhoz rendelik hozzá, mert a helyes változót nem rögzítették a az eredeti adatokat. Ez egy példa a rejtőzködő változó elszámolásának elmulasztására .

Tervezésen alapuló ökonometria

A közelmúltban a tervezés-alapú ökonometria továbbfejlesztett módszertana népszerűsítette mind a természetes kísérletek, mind a kvázi-kísérleti kutatási tervek használatát azoknak az okozati mechanizmusoknak a tanulmányozására, amelyeket az ilyen kísérletek feltételezhetően azonosítanak.

Hibás gyakorlat az ok -okozati következtetésben

Annak ellenére, hogy az ok -okozati összefüggések meghatározására alkalmazott módszerek kifejlesztése előrehaladt, az ok -okozati összefüggések meghatározásában továbbra is jelentős hiányosságok vannak. Ezek a gyengeségek az ok -okozati összefüggések meghatározásának bonyolult bonyolult rendszerekben rejlő nehézségeinek, de a tudományos műhibáknak is betudhatók.

Eltekintve az ok-okozati következtetés nehézségeitől, a társadalomtudósok nagy csoportjai között létezik az a felfogás, hogy a társadalomtudományokban nagyszámú tudós foglalkozik nem tudományos módszertannal. A közgazdászok és társadalomtudósok kritikája, mint ok -okozati tanulmányok leíró tanulmányok továbbadása, elterjedt ezeken a területeken.

Tudományos műhibák és hibás módszertan

A tudományokban, különösen a társadalomtudományokban aggodalomra ad okot a tudósok körében, hogy a tudományos műhibák széles körben elterjedtek. Mivel a tudományos tanulmány széles körű téma, elméletileg határtalan lehetőségek vannak arra, hogy az ok -okozati következtetést a kutató hibája nélkül aláássák. Mindazonáltal továbbra is aggodalomra ad okot a tudósok körében, hogy a kutatók nagy része nem lát el alapvető feladatokat, vagy nem gyakorol kellőképpen eltérő módszereket az ok -okozati következtetésben.

A közös, nem oksági módszertan egyik kiemelkedő példája a korrelációs tulajdonságok, mint oksági tulajdonságok téves feltételezése. A jelenségekben nincs összefüggő kauzalitás. A regressziós modelleket úgy tervezték, hogy mérjék az adatokon belüli varianciát egy elméleti modellhez képest: semmi sem utal arra, hogy a magas kovarianciát mutató adatoknak bármilyen értelmes összefüggésük lenne (a javasolt ok -okozati mechanizmus hiányában, prediktív tulajdonságokkal vagy a kezelés véletlenszerű hozzárendelésével). Azt állították, hogy a hibás módszertan használata széles körben elterjedt, és az ilyen helytelen gyakorlatok gyakori példái a korrelációs modellek túlzott használata, különösen a regressziós modellek és különösen a lineáris regressziós modellek túlzott használata. Az a feltételezés, hogy két összefüggő jelenség eredendően összefügg, logikus tévedés, amelyet hamis korrelációnak neveznek . Egyes társadalomtudósok azt állítják, hogy az ok -okozati összefüggéseket a hamis összefüggéseknek tulajdonító módszertan széles körben elterjedt alkalmazása káros volt a társadalomtudományok integritására, jóllehet a jobb módszerekből származó javulást észleltek.

A tudományos vizsgálatok potenciális hatása, amelyek tévesen összekapcsolják az összefüggést az okozati összefüggéssel, az olyan tudományos eredmények számának növekedése, amelyek eredményeit harmadik fél nem reprodukálhatja. Az ilyen nem reprodukálhatóság logikus következménye azoknak a megállapításoknak, amelyek szerint a korreláció csak ideiglenesen van túlgenerálva olyan mechanizmusokba, amelyeknek nincs összefüggésük, ahol az új adatok nem tartalmazzák az eredeti adatok korábbi, sajátos korrelációit. Folyamatos viták folynak a helytelen gyakorlat és az ok -okozati összefüggések keresésével járó nehézségek hatása miatt. A széles körben gyakorolt ​​módszertanok kritikusai azt állítják, hogy a kutatók statisztikai manipulációt végeztek olyan cikkek közzétételében, amelyek állítólag bizonyítják az ok -okozati összefüggéseket, de valójában példák arra, hogy a hamis korrelációt az okozati összefüggés bizonyítékaként emlegetik: az ilyen törekvéseket P -hackelésnek is nevezhetjük . Ennek megakadályozása érdekében egyesek azt szorgalmazták, hogy a kutatók a tanulmányaik megkezdése előtt regisztrálják előre kutatási tervüket, hogy véletlenül ne hangsúlyozzák túl a nem reprodukálható megállapítást, amely nem volt a vizsgálat első tárgya, de statisztikai szempontból szignifikánsnak bizonyult az adatok elemzése során.

Lásd még

Hivatkozások

Bibliográfia

Külső linkek