Ranglista - Ranking
A rangsor olyan kapcsolat az elemek halmaza között, amely szerint bármelyik két elem esetében az első vagy "magasabb, mint", "alacsonyabb", vagy "egyenlő", a második. A matematikában ezt az objektumok gyenge rendjének vagy teljes előrendelésének nevezik . Ez nem feltétlenül az objektumok teljes sorrendje , mert két különböző objektum azonos rangsorban lehet. Maga a rangsor teljesen rendezett. Például az anyagokat teljes mértékben a keménység határozza meg , míg a keménységi fokokat teljesen megrendelik. Ha két elem azonos rangú, akkor döntetlennek minősül.
Azáltal, hogy a részletes intézkedéseket sorszámsorra redukálja , a rangsor lehetővé teszi az összetett információk bizonyos kritériumok szerinti értékelését. Így például egy internetes keresőmotor rangsorolhatja az általa talált oldalakat a relevanciájuk becslése szerint , így a felhasználó gyorsan kiválaszthatja azokat az oldalakat, amelyeket valószínűleg látni szeretne.
A rangsorolás útján kapott adatok elemzése általában nem paraméteres statisztikákat igényel .
A rangsor kiosztásának stratégiái
Nem mindig lehetséges a rangsor egyedi hozzárendelése. Például egy versenyen vagy versenyen két (vagy több) nevező köthet egy helyet a rangsorban. Soros mérés kiszámításakor a rangsorolt mennyiségek közül kettő (vagy több) egyenlő lehet. Ezekben az esetekben az alábbi stratégiák egyike alkalmazható a rangsoroláshoz. A rangsorolási stratégiák megkülönböztetésének leggyakoribb módja a négy tételnél előállított rangsorok, az első tétel a második és a harmadik előtt (amelyek egyenlőek), mindkettő a negyedik előtt. Ezeket a neveket az alábbiakban is bemutatjuk.
Standard verseny rangsor ("1224" rangsor)
A verseny rangsorában az egyenlőtlen tételek ugyanazt a rangsorolási számot kapják, majd rés marad a rangsorban. Az ebben a résben kimaradt rangsoroló számok eggyel kevesebbek, mint az összehasonlító tételek száma. Hasonlóképpen, az egyes tételek rangsorolási száma 1 plusz a felette rangsorolt tételek száma. Ezt a rangsorolási stratégiát gyakran alkalmazzák a versenyeken, mivel ez azt jelenti, hogy ha két (vagy több) versenyző döntetlen a rangsorban, akkor az alatta lévők helyzete nem változik (azaz a versenyző csak akkor jön a második helyre, ha pontosan egy személy) jobb pontszámot, mint ők, harmadik, ha pontosan két ember jobb, mint ők, negyedik, ha pontosan három ember jobb, mint ők stb.).
Így ha A B és C előtt áll (amelyek összehasonlítják az egyenlőt), amelyek mindketten D előtt vannak, akkor A rangsorban az 1. helyezést ("első"), B a 2. helyezést ("közös második") kapja meg, C pedig rangsort is kap 2. szám ("közös második"), D pedig a 4. helyen áll ("negyedik").
Módosított verseny rangsor ("1334" rangsor)
Néha a verseny rangsorolása úgy történik, hogy a helyezési számok közötti réseket az egyenlő rangú tételek halmazai előtt hagyják (nem pedig azok után, mint a szokásos verseny rangsorolásakor). Az ebben a résben kimaradt rangsoroló számok eggyel kevesebbek maradnak, mint az összehasonlító tételek száma. Hasonlóképpen, az egyes tételek rangsorolási száma megegyezik a vele egyenlő vagy felette rangsorolt tételek számával. Ez a rangsor biztosítja, hogy a versenyző csak akkor kerüljön második helyre, ha egy ellenfelén kívül mindenkinél magasabb pontszámot ért el, harmadik, ha kettő kivételével minden ellenfelénél magasabb pontszámot stb.
Így ha A megelőzi B -t és C -t (akik összehasonlítják az egyenlőt), akik mindketten D rangúak, akkor A rangsorban az első ("első"), B pedig a 3. ("közös harmadik"), C pedig rangsorolást kap 3. ("közös harmadik"), D pedig a 4. helyezést ("negyedik") kapja. Ebben az esetben senki sem kapja meg a 2. helyezést ("második"), és ez résként marad.
Sűrű rangsor ("1223" rangsor)
A sűrű rangsorban az egyenlően összehasonlító tételek ugyanazt a rangsorolási számot kapják, a következő tételek pedig a közvetlenül következő rangsort. Hasonlóképpen, az egyes tételek rangsorolási száma 1 plusz a felette rangsorolt tételek száma, amelyek különböznek a rangsor sorrendjétől.
Így ha A B és C előtt áll (amelyek összehasonlítják az egyenlőt), amelyek mindketten D előtt vannak, akkor A rangsorban az 1. helyezést ("első"), B a 2. helyezést ("közös második") kapja meg, C pedig rangsort is kap 2. szám ("közös második"), D pedig 3. helyezést ("harmadik") kap.
Rendes rangsor ("1234" rangsor)
A sorrendben minden tétel külön sorszámot kap, beleértve az egyenlőtlen tételeket is. A különböző sorszámok hozzárendelése az egyenlőt összehasonlító tételekhez véletlenszerűen vagy tetszőlegesen történhet, de általában előnyösebb egy tetszőleges, de konzisztens rendszert használni, mivel ez többszöri elvégzés esetén stabil eredményeket ad. Egy tetszőleges, de következetes rendszerre példa lehet, ha más attribútumokat is beépítenek a rangsorba (például a versenyző nevének betűrendes sorrendjét) annak biztosítása érdekében, hogy két elem ne egyezzen pontosan.
Ezzel ez a stratégia, ha A rangsorolja megelőzve a B és C (amelyek összehasonlítják egyenlő), amelyek mind rangsorolt előtt D, akkor A kap rangsor 1. számú ( „első”) és a D kap rangsor száma 4 ( „negyedik”), és az sem B a 2. helyezést ("második"), C pedig a 3. ("harmadik"), vagy C a 2. ("második"), B pedig a 3. ("harmadik") ranglistát kapja.
A számítógépes adatfeldolgozásban a sorrendi rangsorolást "sorszámozásnak" is nevezik.
Töredékes rangsor ("1 2,5 2,5 4" rangsor)
Azok a tételek, amelyek összehasonlítják az egyenlőket, ugyanazt a rangsorolási számot kapják, ami azt jelenti , hogy mi lenne a rendes rangsor alatt; ennek megfelelően az 1 -es rangsor plusz a felette rangsorolt tételek száma plusz az ezzel egyenlő tételek fele. Ennek a stratégiának az a tulajdonsága, hogy a rangsoroló számok összege megegyezik a sorrend szerinti rangsorolásával. Ezért használják a Borda -számítások kiszámításához és a statisztikai tesztekhez (lásd alább).
Így ha A a B és C előtt áll (amelyek egyenlőek), mindkettő D előtt, akkor A az 1. helyezést ("első"), B és C pedig a 2.5. ") és D a 4. helyezést (" negyedik ") kapja.
Íme egy példa: Tegyük fel, hogy rendelkezik az 1.0, 1.0, 2.0, 3.0, 3.0, 4.0, 5.0, 5.0, 5.0, 5.0 adatkészlettel.
A sorrend az 1, 2, 3, 4, 5, 6, 7, 8, 9.
V = 1,0 esetén a töredékes rang az ordinális rangok átlaga: (1 + 2) / 2 = 1,5. Hasonló módon, v = 5,0 esetén a tört rang (7 + 8 + 9) / 3 = 8,0.
Így a tört sorok a következők: 1,5, 1,5, 3,0, 4,5, 4,5, 6,0, 8,0, 8,0, 8,0
Ranglista a statisztikákban
A statisztikákban a rangsor az adatátalakítás , amelyben a numerikus vagy sorrendi értékeket az adatok rendezésekor a rangjuk helyettesíti. Például a 3.4., 5.1., 2.6., 7.3. Számadatok figyelhetők meg, ezen adatelemek sora 2, 3, 1 és 4 lesz. Például a forró, hideg, meleg rendszámadatokat 3, 1, 2 helyettesítené. Ezekben a példákban a rangsorok növekvő sorrendben vannak hozzárendelve az értékekhez. (Néhány más esetben csökkenő rangokat használnak.) A rangsorok a rendelési statisztikák indexelt listájához kapcsolódnak , amely az eredeti adatkészletből áll, növekvő sorrendbe rendezve.
A statisztikai tesztek bizonyos fajtái rangsoron alapuló számításokat alkalmaznak. Például:
- Friedman teszt
- Kruskal -Wallis teszt
- A termékek rangsorolása
- Spearman rangkorrelációs együtthatója
- Wilcoxon rang-összeg teszt
- Wilcoxon aláírt rangú teszt
- Van der Waerden teszt
Az értékek csökkenő rangsor szerinti megoszlása gyakran érdekes, ha az értékek nagymértékben eltérnek egymástól; ez a rang-méret eloszlás (vagy rang-gyakorisági eloszlás), például városméret vagy szófrekvencia esetén. Ezek gyakran hatalmi törvényt követnek .
Egyes rangok nem egész számokat tartalmazhatnak a kötött adatértékekhez. Például, ha páros számú példány van ugyanabból az adatértékből, akkor a kötött adatok fent leírt töredékes statisztikai rangja ½ -re végződik. A százalékos rang egy másik típusú statisztikai rangsor.
Rank funkció Excelben
A Microsoft Excel két rangsorolási funkciót kínál, a Rank.EQ függvényt, amely verseny rangokat rendel (1224), és a Rank.AVG függvényt, amely töredékes rangokat ("1 2,5 2,5 4") rendel a fent leírtak szerint. A függvények sorrendi argumentummal rendelkeznek, amely alapértelmezés szerint csökkenő , azaz a legnagyobb szám 1. lesz. Ez általában ritka azoknál a statisztikáknál, ahol a rangsor általában növekvő sorrendben van, ahol a legkisebb szám 1 -es.
A rangsor összehasonlítása
A rangkorreláció használható két rangsor összehasonlítására ugyanazon objektumhalmazra. Például Spearman rangsorolási korrelációs együtthatója hasznos a két verseny versenyzői rangsorai közötti statisztikai függőség mérésére. És a Kendall rangkorrelációs együttható egy másik megközelítés. Alternatívaként a kereszteződésen/átfedésen alapuló megközelítések további rugalmasságot kínálnak. Az egyik példa a "Rank -rank hypergeometric overlap" megközelítés, amelynek célja, hogy összehasonlítsa azon gének rangsorolását, amelyek a differenciálisan expresszált gének két rendezett listájának "tetején" vannak. Hasonló megközelítést alkalmaz a "Rank Biased Overlap (RBO)" is, amely szintén beállítható p valószínűséget valósít meg, hogy testre szabja a kívánt mélységű rangsort. Ezeknek a megközelítéseknek az az előnye, hogy foglalkoznak a diszjunkt halmazokkal , a különböző méretű halmazokkal és a felső súlyozással (figyelembe véve az abszolút rangsorolási pozíciót, amelyet figyelmen kívül hagyhatnak a szokásos nem súlyozott rangkorrelációs megközelítéseknél).
Alkalmazások
Ranglista és társadalmi-gazdasági értékelés
A rangsor-módszerek, amelyek bizonyos mutatókon alapulnak, az egyik leggyakoribb rendszer, amelyet a döntéshozók és a nemzetközi szervezetek használnak az országok társadalmi-gazdasági kontextusának felmérésére. Néhány figyelemre méltó példa: Humán Fejlődési Index (Egyesült Nemzetek), Doing Business Index (Világbank), Korrupciós észlelési index (Transparency International) és Gazdasági Szabadság Index (Örökség Alapítvány). Például a Világbank Doing Business Indicatorja 190 országban méri az üzleti szabályokat és azok végrehajtását. Az országokat 10 mutató szerint rangsorolják, amelyeket szintetizálnak a végső rangsor előállításához. Minden mutató részmutatókból áll; például az ingatlan-nyilvántartási mutató 4 almutatóból áll, amelyek az időt, az eljárásokat, a költségeket és a telekkönyvi rendszer minőségét mérik. Nyilvánvaló, hogy az ilyen rangok a pontszám kiosztásának szubjektív kritériumain alapulnak. Néha az elfogadott paraméterek eltéréseket okozhatnak az empirikus megfigyelésekkel, ezért e kritériumok alkalmazása potenciális torzításokat és paradoxonokat eredményezhet.
Társadalmi játék rangsorolása
A versenyképesség az emberi természet természete. A magasabb társadalmi rang elérésének vágyát az emberek hajtóerejeként lehet felfogni. Egyszerűen fogalmazva, szeretnénk tudni, ki a leggazdagabb, a legokosabb, a legszebb vagy a legszebb. Időnként mások is rangsorolnak minket: felügyelőink, szomszédaink, és összehasonlítjuk a társadalmi helyzetünket a többiekével. Elkerülhetetlen kérdés, hogy ezek a rangsorok mennyire objektívek vagy szubjektívek? Sok rangsorolt lista szubjektív kategorizáláson alapul. Még a kérdést is feltehetjük: mindig azt akarjuk, hogy objektíven lássunk, vagy inkább nem bánjuk, ha jobb képünk van, mint amit megérdemelünk? A társadalom mérésének minden bizonnyal sajátos nehézségei vannak. Ahhoz, hogy megtaláljuk a helyünket a valódi és virtuális közösségekben, meg kell értenünk azokat a problémákat, amelyek az emberi és mesterséges intelligencia ötvözésével az objektivitás és a szubjektivitás közötti navigálás során felmerülő problémákhoz kapcsolódnak. Az e témák kezelésére szolgáló alanyok közé tartozik az összehasonlítás, a rangsorolás, a minősítés, a választások, a törvények, a rangsoroló játékok, a hírnévért folytatott küzdelem stb. (Lásd Érdi Péter).
Más példák
- A politikában a rangsorok az országok gazdasági, társadalmi, környezeti és kormányzási teljesítményének összehasonlítására összpontosítanak, lásd a Nemzetközi rangsorok listája .
- Sok sportágban az egyéneket vagy csapatokat rangsorolja, általában a sport irányító testülete .
- A labdarúgás (foci), a nemzeti csapatok vannak rangsorolva a FIFA világranglistán , a női világranglista , és nem hivatalosan, a World Football Elo értékelő .
- Az olimpiai játékokon minden tagországot ( NOC ) az arany-, ezüst- és bronzérem alapján rangsorolnak az olimpiai érmek rangsorában .
- A kosárlabdában a nemzeti csapatok a FIBA és a női világranglistán szerepelnek .
- A baseball és softball , a nemzeti csapatok vannak rangsorolva a WBSC világranglistán .
- A jégkorongban a nemzeti csapatok szerepelnek az IIHF világranglistán .
- A golfban a legjobb férfi golfozókat a Hivatalos Golf Világranglista alapján , a legjobb női golfozókat pedig a Női Golf Világranglista alapján rangsorolják .
- A snookerben a játékosokat a Snooker világranglistája alapján rangsorolják .
- A teniszben a férfi és a női játékosok rangsorolása az ATP rangsor, illetve a WTA rangsor alapján történik, míg az ITF rangsor a nemzeti Davis Kupa és a Fed Kupa csapatoknál használatos.
- Az országúti kerékpáros versenyekben a férfi kerékpárosokat 2016 -tól az UCI World Ranking alapján rangsorolták, korábban 1984 és 2004 között az UCI Road World Rankings alapján rangsorolták . A női kerékpárosokat 1994 óta rangsorolják az UCI Women Road World Rankings alapján .
- A pályakerékpáros versenyzők és nemzetek rangsorolása az UCI Track Cycling World Ranking alapján történik
- A sakk , a játékosok rangsorolása a FIDE világranglistán .
- A vitorlázás során a hajókat közvetlenül a rangsor összege alapján pontozják.
- A bridge -ben a matchpoint pontozás töredékes rangsorolást használ a pontszám hozzárendeléséhez.
- Ezzel kapcsolatban hitelt helyzetéről, a rangsor a biztonsági utal, hogy amennyiben az adott biztonsági állna egy felhúzható a kibocsátó társaság, azaz a szolgálati idő a vállalat tőkeszerkezet . Például, a tőke jegyzetek vannak alárendelt értékpapírok; végeredményben a rangidős adósság mögé kerülnének. Más szóval, az elsőbbségi adósságot birtokló személyeket kifizetnék, mielőtt az alárendelt adósság tulajdonosai pénzeszközöket kapnának .
- A keresőmotorok a weboldalakat a felhasználói lekérdezésre várt relevanciájuk alapján rangsorolják a lekérdezésfüggő és lekérdezésfüggetlen módszerek kombinációjával. A lekérdezésfüggetlen módszerek megpróbálják mérni az oldal becsült fontosságát, függetlenül attól, hogy mennyire felel meg az adott lekérdezésnek. A lekérdezésfüggetlen rangsorolás rendszerint link-elemzésen alapul; például a HITS algoritmus , a PageRank és a TrustRank . A lekérdezésfüggő módszerek az oldal fontosságától függetlenül megpróbálják mérni, hogy egy oldal mennyire felel meg egy adott lekérdezésnek. A lekérdezésfüggő rangsorolás általában heurisztikákon alapul, amelyek figyelembe veszik a különböző lekérdező szavak egyezésének számát és helyét az oldalon, az URL-ben vagy az oldalra utaló bármely horgonyszövegben .
- A Webometrics -ben lehetőség van az intézmények rangsorolására a webes jelenlétük (weboldalak száma) és ezeknek a tartalmaknak a hatása (külső linkek = webhely -idézetek), például a World Universities Webometrics Ranking szerint
- A videojátékokban a játékosok rangsort kaphatnak. A " rangsorolás " magasabb rangot ér el a többi játékoshoz képest, különösen olyan stratégiákkal, amelyek nem függenek a játékos készségeitől.
- A TrueSkill rangsorolási rendszer a Microsoft Research által kifejlesztett Xbox Live készség alapú rangsorolási rendszer
- A bibliogram sorolja a gyakori főnévi kifejezéseket egy szövegben.
- A nyelvben az elem státusza (általában az úgynevezett "lemaradás" vagy "rangcsere" révén) a záradék legfelső rangjához viszonyítva; például a "Szeretném megenni a tortát, amit ma készítettél" mondatban az "eszik" a legfelső rangon van, de a "készített" rangsorban a "ma elkészített sütemény" névleges csoport részeként szerepel; ez nominális csoport viselkedik, mintha egy főnév (azaz szeretnék enni azt ), és így az ige belül ( „made”) van rangsorolva eltérően „eszik”.
- Tudományos folyóiratokban néha rangsorolása szerint impakt faktor ; az adott folyóirat cikkeit idéző későbbi cikkek száma.