ISO 639 - ISO 639

Az ISO 639 a Nemzetközi Szabványügyi Szervezet szabványainak összessége, amely a nyelvek és nyelvi csoportok nevének ábrázolására vonatkozik .

Ez volt az eredeti szabvány neve is, amelyet 1967 -ben hagytak jóvá ( ISO 639/R szabvány szerint ) és 2002 -ben visszavontak. Az ISO 639 készlet öt részből áll.

ISO 639 kódok használata

Az ISO 639 számos szakaszában meghatározott nyelvkódokat bibliográfiai célokra használják, számítástechnikai és internetes környezetben pedig a területi adatok kulcsfontosságú elemeként . A kódok különféle alkalmazásokban is megtalálhatók, például a Wikipédia URL -címeiben a különböző nyelvi kiadásokhoz.

A szabvány aktuális és történelmi részei

Alapértelmezett Név ( kódok a nyelvek nevének ábrázolásához - ... ) Regisztrációs hatóság Első kiadás Jelenlegi Szám a listában (2021. február 18 -án)
ISO 639-1 1. rész: Alfa-2 kód Infoterm 1967 (ISO 639 szerint) 2002 184
ISO 639-2 2. rész: Alpha-3 kód Kongresszusi Könyvtár 1998 1998 482 + 20 csak B + 4 speciális + 520 helyi használatra
ISO 639-3 3. rész: Alpha-3 kód a nyelvek átfogó lefedéséhez SIL International 2007 2007 7 893 + 4 speciális + 520 helyi használatra
ISO 639-4 4. rész: Végrehajtási irányelvek és általános elvek a nyelvi kódoláshoz ISO / TC 37 / SC 2 2010-07-16 2010-07-16 (nem lista)
ISO 639-5 5. rész: Alpha-3 kód nyelvi családok és csoportok számára Kongresszusi Könyvtár 2008-05-15 2013-02-11 115 (ebből 36 maradék + 29 normál csoport az ISO 632-2 szabvány szerint)
ISO 639-6 6. rész: Alfa-4 ábrázolás a nyelvi változatok átfogó lefedettsége érdekében (visszavonva) Geolang 2009-11-17 visszavont 21 000+

A szabvány minden részét karbantartó ügynökség tartja fenn, amely szükség esetén kódokat ad hozzá és módosítja a kódok állapotát. 2014-ben visszavonták az ISO 639-6 szabványt.

Az egyes kódok jellemzői

Hatályok:

  • Egyéni nyelvek
  • Makronyelvek (3. rész)
  • Nyelvek gyűjteményei (1., 2., 5. rész). Az 1. rész csak egy gyűjteményt tartalmaz ( bh), néhány gyűjtemény már a 2. részben volt, másokat pedig csak az 5. részben adtak hozzá:
    • Fennmaradó csoportok: mind a 2., mind az 5. részben 36 ilyen gyűjtemény található (beleértve azt is, amelyet az 1. részben is kódoltak) - a 2. részsel való kompatibilitás érdekében, amikor az 5. részt még mindig nem tették közzé, a többi csoport nem tartalmaz nyelvet és gyűjteményt amelyet a 2. részben már kódoltak (azonban az 5. résszel kompatibilis új alkalmazások befogadóan kezelhetik ezeket a csoportokat, amennyiben tiszteletben tartják az 5. részben közzétett elszigetelési hierarchiát, és a legkülönlegesebb gyűjteményt használják a nyelvek csoportosításakor);
    • Rendszeres csoportok: 29 gyűjtemény mind a 2., mind az 5. részben ilyen jellegű - a 2. részsel való kompatibilitás érdekében nem tartalmazhatnak más csoportokat;
    • Családok: 50 új gyűjtemény, amelyek csak az 5. részben vannak kódolva (beleértve azt is, amelyik a 2. részben már kódolt szabályos csoportot tartalmazza) - a 2. részsel való kompatibilitás érdekében a többi csoporton kívül más gyűjteményeket is tartalmazhatnak.
  • Nyelvjárások : a 6. rész hatálya alá akarták tartozni (javasolt, de most visszavont).
  • Különleges helyzetek (2., 3. rész).
  • Helyi használatra fenntartva (2., 3. rész). Néha olyan alkalmazásokban is használják, amelyek alfa-2 kódot igényelnek, például az 1. és 2. rész szabványos kódjait (ahol a speciális kód misnem megfelelő), vagy alfa-3 kódot olyan gyűjteményekhez, mint az 5. rész szabványos kódjai.

Típusok (az egyes nyelvekhez):

  • Élő nyelvek (2., 3. rész) (minden makronyelv élő nyelv)
  • Kihalt nyelvek (2., 3.) (608, 5 közülük a 2. rész: chb, chg, cop, lui, sam, egyik sem az 1. rész)
  • Ókori nyelvek (Parts 1, 2, 3) (124, 19 közülük a 2. rész; és 5 őket, nevezetesen ave, chu, lat, pliés san, is van egy kódot 1. rész: ae, cu, la, pi, sa)
  • Történelmi nyelvek (2., 3. rész) (83, 16 közülük a 2. részben; egyik sem az 1. részben)
  • Létrehozott nyelvek (Parts 1, 2, 3) (22, 9 közülük 2. rész: afh, epo, ido, ile, ina, jbo, tlh, vol, zbl; 5 őket 1. rész: eo, ia, ie, io, vo)

Az egyes nyelvek és makronyelvek két különálló alfa-3 kóddal a 2. részben:

  • Bibliográfiai (némelyik elavult, egyiket sem határozták meg a 3. részben): ezek örökölt kódok (az angol nyelvnevek alapján).
  • Terminológiai (a 3. részben is definiált): ezek a preferált kódok (anyanyelvi nevek alapján, szükség esetén romanizált formában).
  • Minden más (beleértve a nyelvek gyűjteményeit és a különleges/fenntartott kódokat is) csak egyetlen alfa-3 kódot tartalmaz mindkét felhasználásra.

A részek közötti kapcsolatok

Az ISO 639 különböző részeit úgy tervezték, hogy együtt működjenek, oly módon, hogy egyik kód sem jelent egyet az egyik részben, és mást a másikban. Azonban nem minden nyelv minden részből áll, és a különböző nyelvek és egyéb elemek kezelése különböző módokon lehetséges. Ez például attól függ, hogy egy nyelv szerepel -e az 1. vagy 2. részben, van -e külön B/T kódja a 2. részben, vagy makronyelvnek minősül a 3. részben, és így tovább.

Ezeket a különféle kezeléseket a következő táblázat részletezi. A sorok minden csoportjában (egy az ISO 639-3 minden hatóköréhez) az utolsó négy oszlop egy reprezentatív nyelv kódjait tartalmazza, amely az ISO 639 részei közötti konkrét típusú kapcsolatokat példázza, a második oszlop a kapcsolat magyarázatát tartalmazza , és az első oszlop azt jelzi, hogy hány elem rendelkezik ilyen típusú kapcsolattal. Például négy elem rendelkezik kóddal az 1. részben, B / T kóddal, és a 3. részben makronyelvként van besorolva. E négy elem egyik képviselője a "perzsa" fa/ per/ fas.

Hatály Az esetek száma Leírás Példa a megfelelő kódokra
ISO 639-1 ISO 639-2 ISO 639-3 ISO 639-5
Az egyes nyelvek
("I")
128 Egyetlen nyelv, amely nem része a makronyelvnek, kóddal az 1., 2. és 3. részben (csak egy kód a 2. részben).
184 kód van az 1. részben az egyes nyelvekhez, makronyelvekhez vagy csoportokhoz; vonja le az alábbi sorokban számoltakat, így marad: 184 - (2 "I (volt B/T)") - (3+11 "I") - (3+2 "I (B/T)") - (28 +4+1+1 "M") - (1 "C") = 128 kód.
hu eng -
2 Az egyes nyelvek, kóddal az 1., 2. és 3. részben, amelyek külön B/T-kódokkal rendelkeztek a 2. részben, de amelyek B-kódjait visszavonták (2008-06-28 óta), megőrizve T-kódjaikat minden felhasználásra. Ezek a következők: hr/ ( scr) / hrvés sr/ ( ser) / srp.
Mindkettő ugyanazon makronyelv része, amelyet a hbs3. részben adtak hozzá, hogy más újonnan kódolt egyedi nyelveket is tartalmazzon, de az sh1. részben található kódját is visszavonták, és nem tartalmazott kódot a 2. részben.
óra (scr)/hrv (B/T) hrv
3 A 3. részben egy makronyelvhez tartozó egyes nyelvek, a 2. részben egyetlen kóddal, és az 1. részben egy kóddal. Ezek: bs/ bos(a makronyelv része hbs), nb/ nobés nn/ non(mind a makronyelv része no/ nor). nb fej
11 Az egyes nyelvek külön B/T kódokkal a 2. részben, de a különleges sorok egyikében sem a következő sorokban.
A 2. részben 20 pár különálló B/T kód van hozzárendelve az egyes nyelvekhez vagy makronyelvekhez; vonja le az alábbi speciális eseteket, így marad: 20 - (3+2 "M") - (4 "C") = 11 pár kód.
de ger/deu (B/T) deu
3 Az egyes nyelvek külön B/T kódokkal a 2. részben, de az 1. rész kódjának betűi nem a 2. rész T kódjának első két betűje. Ezek a következők: cs/ cze/ ces, mi/ mao/ mriés sk/ slo/ slk. cs cze/ces (B/T) ces
3 Az egyes nyelvek a 2. és 3. részben (nem tartoznak a makronyelvhez), de amelyeket az 1. rész olyan kóddal fedezett le, amelynek megfelelője a 2. részben egy gyűjtemény. Ezek a következők: bho, maiés mag. (bh) bho
kevés Bármely más egyéni nyelv a 2. és 3. részben, kód nélkül az 1. részben. - aszt
1 A 3. részben hozzáadott egyes nyelvek az 1. és 2. részben kódok nélkül, de amelyeket az 1. részben is kódolt 2. és 3. rész makronyelv fedett le. (ar) (ara) arb
1 Egy egyéni nyelv a 3. részben, kód nélkül a 2. részben, de az 1. részben egy olyan kód terjedt ki, amelynek megfelelője a 2. részben egy kollektív csoport (lásd az alábbi bejegyzést ehhez a csoporthoz). (bh) (bih) sck
> 7000 Bármely más egyéni nyelv a 3. részben az 1. és 2. rész kódja nélkül (a 2. részben esetleg gyűjtő kód, például nic"Niger-Kodofanian (Other)", amely egy maradék csoport). - (szép) ááá
Makronyelvek
("M")
28 Makronyelvek a 3. részben, amelyek kódokkal is rendelkeznek az 1. és 2.
részben. A 3. részben 62 kód van hozzárendelve a makronyelvekhez; vonja le azokat, akiknek speciális esetei vannak az alábbiakban, így marad: 62 - (4 "B/T") - 1 - (25+1+3 "nincs az 1. részben") = 28 kód.
ar ara
4 Makronyelvek a 3. részben, külön B / T kódokkal a 2. részben. Ezek: fa/ per/ fas, ms/ may/ msa, sq/ alb/ sqiés zh/ chi/ zho. fa per/fas (B/T) fas
1 Makronyelv a 3. részben, amely olyan nyelveket tartalmaz, amelyek kódjai az 1. részben vannak. Csak: no/ nor(tartalmazza: nb/ nob, és nn/ non). nem sem
25 Makronyelvek a 2. és 3. részben, de kód nélkül az 1. részben. - bal
1 Makronyelv a 3. részben, kód nélkül a 2. részben, és amelynek kódja az 1. részben elavult. (SH) - hbs
3 Macrolanguages 3. részében, anélkül kódok részében 1 vagy 2. Ezek a következők: bnc, kln, és luy. - - bnc
Családok és csoportok (kollektív)
("C")
1 A Bihari gyűjteményként van megjelölve, és rendelkezik ISO 639-2 kóddal, és ez az egyetlen nyelvcsoport, amely rendelkezik ISO 639-1 kóddal is (ahol az összes többi kód egyedi nyelv vagy fenntartott). Ennek az az oka, hogy a három egyéni Bihari nyelv (melyek különböznek elég, hogy nem képezheti ugyanazon macrolanguage ISO 639-3) kapott megkülönböztető ISO 639-2 kód ( bho, mai, mag), amely lehetővé tette a Bihari fennmaradó csoport céljára ISO 639-2 (a csoport nyelveit tartalmazza, kivéve ezt a három nyelvet). bh bih - bih
35 A 2. rész többi csoportja, azaz ugyanaz a kód, de különböző nyelvek is. A 2. részben afaolyan afro-ázsiai nyelvre utal, amely nem rendelkezik egyéni nyelvű azonosítóval a 2. részben, és amely nem tartozik a többi három csoportba: ber„berber (egyéb)”, cus„kusita (más)”, vagy sem"Sémi (egyéb)", amelyek mindegyike afro-ázsiai nyelvcsoport. - afa afa
29 Rendes csoport a 2. részben, ugyanaz, mint az 5. rész nyelvcsaládja, nincs kód az 1. részben. Közülük a ypk2. részben található rendes csoport volt az egyetlen, amelyet az 5. részben kódoltak az 5. részben egy másik új rendszeres csoport részeként 5, amely nem volt kódolva a 2. részben (lásd alább). aus aus
50 Rendszeres csoportok adni csak az 5. részben, korábban nem kódolt 1., 2. és 3. A legtöbb ilyen új, rendszeres csoport korábban már más és más kollektív kód 2. részében részeként fennmaradó csoport (például a fennmaradó csoport ineszámára az új, rendszeres csoport sqj), kivéve közülük 7: aav, esx, euq, hmx, jpx, urj, valamint a syd(részben a rendszeres új csoport urj). A rendes csoport ypk(az új rendes csoport része esx) azonban már a 2. részben kódolva volt. Lásd a nyelvi csoportok hierarchiáját az ISO 639-5 kódok listájában . - sqj
Különleges kódok
("S")
1 Egynyelvű környezetben használható, ahol egyéni nyelvkód szükséges, de maga a nyelv nem rendelkezik szabványos kóddal. Pontosabb alternatíva lehet az ISO 639-2 fennmaradó csoportjának használata vagy az ISO 639-5 nyelvcsalád-kód használata, kivéve, ha az adott csoport többi nyelvét ki kell zárni (mivel saját kóddal vannak elválasztva), vagy nincs szabványos gyűjtő kód megfelelő. Előfordulhat, hogy egyes alkalmazások a helyi használatra fenntartott kódokon belül inkább specifikus kódot használnak. - mis -
1 Többnyelvű tartalom (legalább két nyelvet tartalmaz elválasztható részekben). Akkor kell használni, ha a teljes tartalomra egyetlen nyelvi kódot várnak. Előfordulhat, hogy a tartalom egyes részeinek egyes nyelvei vagy makrónyelvei még mindig kódolatlanok (és reprezentálhatók, misvagy pontosabban egy közös kóddal). mul
1 Nincs meghatározva (a tartalom nulla, egy vagy több nyelvet tartalmaz tetszőleges kombinációban). und
1 Nyelvi információ egyáltalán nincs (hozzáadva 2006-01-11). A tartalom (pl. Grafika, fénykép vagy hang-/videofelvétel, amely nem tartalmaz emberi nyelven szöveget, vagy technikai metaadatokat és a legtöbb programozási forráskódot) ugyanúgy használható, mint bármely nyelv, és nem szabad lefordítani (kivéve a leírását, amely esetleg külön tartalom, vagy a tartalom nem lényeges töredékei esetén). zxx
Helyi használatra fenntartva
("R")
20 A2 kódok 1. rész tartományban qa.. qt. Ezek a kódok nem ajánlottak, de az 1. részben nincsenek hozzárendelve. qa -
520 Alpha3 kódok a 2. és 3. részben, a qaa... tartományban qtz. Ezeket a kódokat közös nyelvekhez is lehet használni (vagy más speciális esetekhez), de az 5. részben nem rendelnek hozzájuk szabványos nyelvcsaládokat és csoportokat. - qaa

Ezeket a különbségeket a következő tényezők okozzák.

Az ISO 639-2 szabványban két különböző kódot rendeltek hozzá 22 nyelvhez, nevezetesen egy bibliográfiai és egy terminológiai kódot (B/T kódok). A B kódok történelmi okokból kerültek bele, mert a korábbi, széles körben használt bibliográfiai rendszerek a nyelv angol neve alapján használt nyelvi kódokat használták. Ezzel szemben az ISO 639-1 kódok a nyelv natív nevén alapultak, és erős vágy volt az is, hogy ezekhez a nyelvekhez 639-2 kód (T kód) legyen, amelyek hasonlóak a megfelelő 2 karakterből álló kódhoz ISO 639-1.

  • Például a német nyelv (1. rész de:) két kóddal rendelkezik a 2. részben: ger(B kód) és deu(T kód), míg a 2. részben csak egy kód található engaz angol nyelvre .
  • 2 korábbi B kódot vontak vissza, ma már csak 20 pár B/T kód marad.

A 2. részben található egyes nyelveknek mindig van kódjuk a 3. részben (ott csak a 2. rész terminológiai kódját használják fel újra), de lehet, hogy nincs kódjuk az 1. részben, amint azt a következő példák illusztrálják:

  • A 3. rész engmegfelel a 2. engés az 1. részneken
  • A 3. rész astmegfelel a 2. résznek, astde hiányzik belőle egy kód az 1. részben.

A 3. részben néhány kód (62) makronyelv. Ezek olyan csoportok, amelyek több egyéni nyelvet tartalmaznak, és amelyek jól megértik egymást, és általában vegyesek vagy zavarosak. Néhány makrónyelv alapértelmezett szabványos űrlapot fejlesztett ki valamelyik saját nyelvén (pl. Alapértelmezés szerint a mandarin a kínai makronyelvre vonatkozik, más nyelvek szükség esetén továbbra is megkülönböztethetők, de a cmnmandarin speciális kódját ritkán használják).

  • Az 1 makrónyelv rendelkezik a 2. rész kódjával és az 1. rész kódjával, míg a tagok egyes nyelvei az 1. és 2. részben található kódokkal is rendelkeznek: nor/ notartalmaz non/ nn, nob/ nb; vagy
  • 4 makronyelv két 2. rész kóddal (B / T) és egy 1. rész kóddal rendelkezik: per/ fas/ fa, may/ msa/ ms, alb/ sqi/ sqés chi/ zho/ zh;
  • 28 makronyelv rendelkezik 2. rész kóddal, de nincs 1. rész kóddal;
  • 29 másik makronyelv csak kódokat tartalmaz a 3. részben.

A 2. részben található gyűjtő kódoknak van egy kódja az 5. részben: pl aus. A 2. és 5. részben, ami az ausztrál nyelveket jelenti .

  • A 2. rész egyik kollektív kódjának kódja is van az 1. részben: bih/ bh.
  • Néhány kód hozzáadásra került az 5. részben, de a 2. részben nem volt kód: pl sqj

A 2. és 3. rész fenntartott tartományt és négy speciális kódot is tartalmaz:

  • A kódok qaasegítségével qtza helyi használatra van fenntartva.
  • Négy speciális kód létezik: azokhoz misa nyelvekhez, amelyekhez még nincs hozzárendelve kód, mula "több nyelvhez", unda "nem meghatározott" és zxxa "nincs nyelvi tartalom, nem alkalmazható" kódokhoz .

Kódtér

Alfa-2 kódtér

Az "Alpha-2" kódokat (az ISO alap latin ábécé 2 betűjéből álló kódokhoz ) az ISO 639-1 szabvány használja . Ha a nyelvek szélesebb körének kódjait kívánták, több mint 2 betűkombinációt tudtak fedezni (legfeljebb 26 2 = 676), az ISO 639-2- t alfa-3 kódok felhasználásával fejlesztették ki. (Ez utóbbit azonban hivatalosan először tették közzé.)

Alfa-3 kódtér

Az "Alpha-3" kódokat (az ISO alap latin ábécé 3 betűjéből álló kódokhoz ) az ISO 639-2 , ISO 639-3 és ISO 639-5 szabványok használják . Az így ábrázolható nyelvek és nyelvcsoportok száma 26 3 = 17.576.

Az Alpha-3 kódok közös használata az ISO 639 három részében bizonyos koordinációt igényel egy nagyobb rendszeren belül.

2. rész határozza meg a négy speciális kódok mis, mul, und, zxx, egy fenntartott tartomány qaa-qtz(20 × 26 = 520 kódok), és 20 két- bejegyzés (a B / T kódok), plusz 2 bejegyzéseket megszüntetett B-kódok. Ez összegez 520 + 22 + 4 = 546 kódot, amelyek nem használhatók a 3. részben a nyelvek vagy az 5. részben a nyelvcsaládok vagy csoportok ábrázolására. A maradék 17 576 - 546 = 17 030.

Ma valahol hat -hétezer nyelv van a Földön. Tehát ez a 17 030 kód elegendő ahhoz, hogy minden nyelvhez egyedi kódot rendeljen, bár egyes nyelvek tetszőleges kódokkal zárulhatnak, amelyek nem hasonlítanak az adott nyelv hagyományos nevére.

Alfa-4 kódtér (visszavonva)

Az "Alpha-4" kódokat (az ISO alap latin ábécé 4 betűjéből álló kódokhoz ) javasolták használni az ISO 639-6 szabványban , amelyet visszavontak. Az ábrázolható nyelvek és nyelvjárások számának felső határa 26 4 = 456 976.

Lásd még

Jegyzetek és hivatkozások

Külső linkek