ISO 639 - ISO 639
Az ISO 639 a Nemzetközi Szabványügyi Szervezet szabványainak összessége, amely a nyelvek és nyelvi csoportok nevének ábrázolására vonatkozik .
Ez volt az eredeti szabvány neve is, amelyet 1967 -ben hagytak jóvá ( ISO 639/R szabvány szerint ) és 2002 -ben visszavontak. Az ISO 639 készlet öt részből áll.
ISO 639 kódok használata
Az ISO 639 számos szakaszában meghatározott nyelvkódokat bibliográfiai célokra használják, számítástechnikai és internetes környezetben pedig a területi adatok kulcsfontosságú elemeként . A kódok különféle alkalmazásokban is megtalálhatók, például a Wikipédia URL -címeiben a különböző nyelvi kiadásokhoz.
A szabvány aktuális és történelmi részei
Alapértelmezett | Név ( kódok a nyelvek nevének ábrázolásához - ... ) | Regisztrációs hatóság | Első kiadás | Jelenlegi | Szám a listában (2021. február 18 -án) |
---|---|---|---|---|---|
ISO 639-1 | 1. rész: Alfa-2 kód | Infoterm | 1967 (ISO 639 szerint) | 2002 | 184 |
ISO 639-2 | 2. rész: Alpha-3 kód | Kongresszusi Könyvtár | 1998 | 1998 | 482 + 20 csak B + 4 speciális + 520 helyi használatra |
ISO 639-3 | 3. rész: Alpha-3 kód a nyelvek átfogó lefedéséhez | SIL International | 2007 | 2007 | 7 893 + 4 speciális + 520 helyi használatra |
ISO 639-4 | 4. rész: Végrehajtási irányelvek és általános elvek a nyelvi kódoláshoz | ISO / TC 37 / SC 2 | 2010-07-16 | 2010-07-16 | (nem lista) |
ISO 639-5 | 5. rész: Alpha-3 kód nyelvi családok és csoportok számára | Kongresszusi Könyvtár | 2008-05-15 | 2013-02-11 | 115 (ebből 36 maradék + 29 normál csoport az ISO 632-2 szabvány szerint) |
ISO 639-6 | 6. rész: Alfa-4 ábrázolás a nyelvi változatok átfogó lefedettsége érdekében (visszavonva) | Geolang | 2009-11-17 | visszavont | 21 000+ |
A szabvány minden részét karbantartó ügynökség tartja fenn, amely szükség esetén kódokat ad hozzá és módosítja a kódok állapotát. 2014-ben visszavonták az ISO 639-6 szabványt.
Az egyes kódok jellemzői
Hatályok:
- Egyéni nyelvek
- Makronyelvek (3. rész)
- Nyelvek gyűjteményei (1., 2., 5. rész). Az 1. rész csak egy gyűjteményt tartalmaz (
bh
), néhány gyűjtemény már a 2. részben volt, másokat pedig csak az 5. részben adtak hozzá:- Fennmaradó csoportok: mind a 2., mind az 5. részben 36 ilyen gyűjtemény található (beleértve azt is, amelyet az 1. részben is kódoltak) - a 2. részsel való kompatibilitás érdekében, amikor az 5. részt még mindig nem tették közzé, a többi csoport nem tartalmaz nyelvet és gyűjteményt amelyet a 2. részben már kódoltak (azonban az 5. résszel kompatibilis új alkalmazások befogadóan kezelhetik ezeket a csoportokat, amennyiben tiszteletben tartják az 5. részben közzétett elszigetelési hierarchiát, és a legkülönlegesebb gyűjteményt használják a nyelvek csoportosításakor);
- Rendszeres csoportok: 29 gyűjtemény mind a 2., mind az 5. részben ilyen jellegű - a 2. részsel való kompatibilitás érdekében nem tartalmazhatnak más csoportokat;
- Családok: 50 új gyűjtemény, amelyek csak az 5. részben vannak kódolva (beleértve azt is, amelyik a 2. részben már kódolt szabályos csoportot tartalmazza) - a 2. részsel való kompatibilitás érdekében a többi csoporton kívül más gyűjteményeket is tartalmazhatnak.
- Nyelvjárások : a 6. rész hatálya alá akarták tartozni (javasolt, de most visszavont).
- Különleges helyzetek (2., 3. rész).
- Helyi használatra fenntartva (2., 3. rész). Néha olyan alkalmazásokban is használják, amelyek alfa-2 kódot igényelnek, például az 1. és 2. rész szabványos kódjait (ahol a speciális kód
mis
nem megfelelő), vagy alfa-3 kódot olyan gyűjteményekhez, mint az 5. rész szabványos kódjai.
Típusok (az egyes nyelvekhez):
- Élő nyelvek (2., 3. rész) (minden makronyelv élő nyelv)
-
Kihalt nyelvek (2., 3.) (608, 5 közülük a 2. rész:
chb
,chg
,cop
,lui
,sam
, egyik sem az 1. rész) -
Ókori nyelvek (Parts 1, 2, 3) (124, 19 közülük a 2. rész; és 5 őket, nevezetesen
ave
,chu
,lat
,pli
éssan
, is van egy kódot 1. rész:ae
,cu
,la
,pi
,sa
) - Történelmi nyelvek (2., 3. rész) (83, 16 közülük a 2. részben; egyik sem az 1. részben)
-
Létrehozott nyelvek (Parts 1, 2, 3) (22, 9 közülük 2. rész:
afh
,epo
,ido
,ile
,ina
,jbo
,tlh
,vol
,zbl
; 5 őket 1. rész:eo
,ia
,ie
,io
,vo
)
Az egyes nyelvek és makronyelvek két különálló alfa-3 kóddal a 2. részben:
- Bibliográfiai (némelyik elavult, egyiket sem határozták meg a 3. részben): ezek örökölt kódok (az angol nyelvnevek alapján).
- Terminológiai (a 3. részben is definiált): ezek a preferált kódok (anyanyelvi nevek alapján, szükség esetén romanizált formában).
- Minden más (beleértve a nyelvek gyűjteményeit és a különleges/fenntartott kódokat is) csak egyetlen alfa-3 kódot tartalmaz mindkét felhasználásra.
A részek közötti kapcsolatok
Az ISO 639 különböző részeit úgy tervezték, hogy együtt működjenek, oly módon, hogy egyik kód sem jelent egyet az egyik részben, és mást a másikban. Azonban nem minden nyelv minden részből áll, és a különböző nyelvek és egyéb elemek kezelése különböző módokon lehetséges. Ez például attól függ, hogy egy nyelv szerepel -e az 1. vagy 2. részben, van -e külön B/T kódja a 2. részben, vagy makronyelvnek minősül a 3. részben, és így tovább.
Ezeket a különféle kezeléseket a következő táblázat részletezi. A sorok minden csoportjában (egy az ISO 639-3 minden hatóköréhez) az utolsó négy oszlop egy reprezentatív nyelv kódjait tartalmazza, amely az ISO 639 részei közötti konkrét típusú kapcsolatokat példázza, a második oszlop a kapcsolat magyarázatát tartalmazza , és az első oszlop azt jelzi, hogy hány elem rendelkezik ilyen típusú kapcsolattal. Például négy elem rendelkezik kóddal az 1. részben, B / T kóddal, és a 3. részben makronyelvként van besorolva. E négy elem egyik képviselője a "perzsa" fa
/ per
/ fas
.
Hatály | Az esetek száma | Leírás | Példa a megfelelő kódokra | |||
---|---|---|---|---|---|---|
ISO 639-1 | ISO 639-2 | ISO 639-3 | ISO 639-5 | |||
Az egyes nyelvek ("I") |
128 | Egyetlen nyelv, amely nem része a makronyelvnek, kóddal az 1., 2. és 3. részben (csak egy kód a 2. részben). 184 kód van az 1. részben az egyes nyelvekhez, makronyelvekhez vagy csoportokhoz; vonja le az alábbi sorokban számoltakat, így marad: 184 - (2 "I (volt B/T)") - (3+11 "I") - (3+2 "I (B/T)") - (28 +4+1+1 "M") - (1 "C") = 128 kód. |
hu | eng | - | |
2 | Az egyes nyelvek, kóddal az 1., 2. és 3. részben, amelyek külön B/T-kódokkal rendelkeztek a 2. részben, de amelyek B-kódjait visszavonták (2008-06-28 óta), megőrizve T-kódjaikat minden felhasználásra. Ezek a következők: hr / ( scr ) / hrv és sr / ( ser ) / srp . Mindkettő ugyanazon makronyelv része, amelyet a hbs 3. részben adtak hozzá, hogy más újonnan kódolt egyedi nyelveket is tartalmazzon, de az sh 1. részben található kódját is visszavonták, és nem tartalmazott kódot a 2. részben.
|
óra | (scr)/hrv (B/T) | hrv | ||
3 | A 3. részben egy makronyelvhez tartozó egyes nyelvek, a 2. részben egyetlen kóddal, és az 1. részben egy kóddal. Ezek: bs / bos (a makronyelv része hbs ), nb / nob és nn / non (mind a makronyelv része no / nor ).
|
nb | fej | |||
11 | Az egyes nyelvek külön B/T kódokkal a 2. részben, de a különleges sorok egyikében sem a következő sorokban. A 2. részben 20 pár különálló B/T kód van hozzárendelve az egyes nyelvekhez vagy makronyelvekhez; vonja le az alábbi speciális eseteket, így marad: 20 - (3+2 "M") - (4 "C") = 11 pár kód. |
de | ger/deu (B/T) | deu | ||
3 | Az egyes nyelvek külön B/T kódokkal a 2. részben, de az 1. rész kódjának betűi nem a 2. rész T kódjának első két betűje. Ezek a következők: cs / cze / ces , mi / mao / mri és sk / slo / slk .
|
cs | cze/ces (B/T) | ces | ||
3 | Az egyes nyelvek a 2. és 3. részben (nem tartoznak a makronyelvhez), de amelyeket az 1. rész olyan kóddal fedezett le, amelynek megfelelője a 2. részben egy gyűjtemény. Ezek a következők: bho , mai és mag .
|
(bh) | bho | |||
kevés | Bármely más egyéni nyelv a 2. és 3. részben, kód nélkül az 1. részben. | - | aszt | |||
1 | A 3. részben hozzáadott egyes nyelvek az 1. és 2. részben kódok nélkül, de amelyeket az 1. részben is kódolt 2. és 3. rész makronyelv fedett le. | (ar) | (ara) | arb | ||
1 | Egy egyéni nyelv a 3. részben, kód nélkül a 2. részben, de az 1. részben egy olyan kód terjedt ki, amelynek megfelelője a 2. részben egy kollektív csoport (lásd az alábbi bejegyzést ehhez a csoporthoz). | (bh) | (bih) | sck | ||
> 7000 | Bármely más egyéni nyelv a 3. részben az 1. és 2. rész kódja nélkül (a 2. részben esetleg gyűjtő kód, például nic "Niger-Kodofanian (Other)", amely egy maradék csoport).
|
- | (szép) | ááá | ||
Makronyelvek ("M") |
28 | Makronyelvek a 3. részben, amelyek kódokkal is rendelkeznek az 1. és 2. részben. A 3. részben 62 kód van hozzárendelve a makronyelvekhez; vonja le azokat, akiknek speciális esetei vannak az alábbiakban, így marad: 62 - (4 "B/T") - 1 - (25+1+3 "nincs az 1. részben") = 28 kód. |
ar | ara | ||
4 | Makronyelvek a 3. részben, külön B / T kódokkal a 2. részben. Ezek: fa / per / fas , ms / may / msa , sq / alb / sqi és zh / chi / zho .
|
fa | per/fas (B/T) | fas | ||
1 | Makronyelv a 3. részben, amely olyan nyelveket tartalmaz, amelyek kódjai az 1. részben vannak. Csak: no / nor (tartalmazza: nb / nob , és nn / non ).
|
nem | sem | |||
25 | Makronyelvek a 2. és 3. részben, de kód nélkül az 1. részben. | - | bal | |||
1 | Makronyelv a 3. részben, kód nélkül a 2. részben, és amelynek kódja az 1. részben elavult. | (SH) | - | hbs | ||
3 | Macrolanguages 3. részében, anélkül kódok részében 1 vagy 2. Ezek a következők: bnc , kln , és luy .
|
- | - | bnc | ||
Családok és csoportok (kollektív) ("C") |
1 |
A Bihari gyűjteményként van megjelölve, és rendelkezik ISO 639-2 kóddal, és ez az egyetlen nyelvcsoport, amely rendelkezik ISO 639-1 kóddal is (ahol az összes többi kód egyedi nyelv vagy fenntartott). Ennek az az oka, hogy a három egyéni Bihari nyelv (melyek különböznek elég, hogy nem képezheti ugyanazon macrolanguage ISO 639-3) kapott megkülönböztető ISO 639-2 kód ( bho , mai , mag ), amely lehetővé tette a Bihari fennmaradó csoport céljára ISO 639-2 (a csoport nyelveit tartalmazza, kivéve ezt a három nyelvet).
|
bh | bih | - | bih |
35 | A 2. rész többi csoportja, azaz ugyanaz a kód, de különböző nyelvek is. A 2. részben afa olyan afro-ázsiai nyelvre utal, amely nem rendelkezik egyéni nyelvű azonosítóval a 2. részben, és amely nem tartozik a többi három csoportba: ber „berber (egyéb)”, cus „kusita (más)”, vagy sem "Sémi (egyéb)", amelyek mindegyike afro-ázsiai nyelvcsoport.
|
- | afa | afa | ||
29 | Rendes csoport a 2. részben, ugyanaz, mint az 5. rész nyelvcsaládja, nincs kód az 1. részben. Közülük a ypk 2. részben található rendes csoport volt az egyetlen, amelyet az 5. részben kódoltak az 5. részben egy másik új rendszeres csoport részeként 5, amely nem volt kódolva a 2. részben (lásd alább).
|
aus | aus | |||
50 | Rendszeres csoportok adni csak az 5. részben, korábban nem kódolt 1., 2. és 3. A legtöbb ilyen új, rendszeres csoport korábban már más és más kollektív kód 2. részében részeként fennmaradó csoport (például a fennmaradó csoport ine számára az új, rendszeres csoport sqj ), kivéve közülük 7: aav , esx , euq , hmx , jpx , urj , valamint a syd (részben a rendszeres új csoport urj ). A rendes csoport ypk (az új rendes csoport része esx ) azonban már a 2. részben kódolva volt. Lásd a nyelvi csoportok hierarchiáját az ISO 639-5 kódok listájában .
|
- | sqj | |||
Különleges kódok ("S") |
1 | Egynyelvű környezetben használható, ahol egyéni nyelvkód szükséges, de maga a nyelv nem rendelkezik szabványos kóddal. Pontosabb alternatíva lehet az ISO 639-2 fennmaradó csoportjának használata vagy az ISO 639-5 nyelvcsalád-kód használata, kivéve, ha az adott csoport többi nyelvét ki kell zárni (mivel saját kóddal vannak elválasztva), vagy nincs szabványos gyűjtő kód megfelelő. Előfordulhat, hogy egyes alkalmazások a helyi használatra fenntartott kódokon belül inkább specifikus kódot használnak. | - | mis | - | |
1 | Többnyelvű tartalom (legalább két nyelvet tartalmaz elválasztható részekben). Akkor kell használni, ha a teljes tartalomra egyetlen nyelvi kódot várnak. Előfordulhat, hogy a tartalom egyes részeinek egyes nyelvei vagy makrónyelvei még mindig kódolatlanok (és reprezentálhatók, mis vagy pontosabban egy közös kóddal).
|
mul | ||||
1 | Nincs meghatározva (a tartalom nulla, egy vagy több nyelvet tartalmaz tetszőleges kombinációban). | und | ||||
1 | Nyelvi információ egyáltalán nincs (hozzáadva 2006-01-11). A tartalom (pl. Grafika, fénykép vagy hang-/videofelvétel, amely nem tartalmaz emberi nyelven szöveget, vagy technikai metaadatokat és a legtöbb programozási forráskódot) ugyanúgy használható, mint bármely nyelv, és nem szabad lefordítani (kivéve a leírását, amely esetleg külön tartalom, vagy a tartalom nem lényeges töredékei esetén). | zxx | ||||
Helyi használatra fenntartva ("R") |
20 | A2 kódok 1. rész tartományban qa .. qt . Ezek a kódok nem ajánlottak, de az 1. részben nincsenek hozzárendelve.
|
qa | - | ||
520 | Alpha3 kódok a 2. és 3. részben, a qaa ... tartományban qtz . Ezeket a kódokat közös nyelvekhez is lehet használni (vagy más speciális esetekhez), de az 5. részben nem rendelnek hozzájuk szabványos nyelvcsaládokat és csoportokat.
|
- | qaa |
Ezeket a különbségeket a következő tényezők okozzák.
Az ISO 639-2 szabványban két különböző kódot rendeltek hozzá 22 nyelvhez, nevezetesen egy bibliográfiai és egy terminológiai kódot (B/T kódok). A B kódok történelmi okokból kerültek bele, mert a korábbi, széles körben használt bibliográfiai rendszerek a nyelv angol neve alapján használt nyelvi kódokat használták. Ezzel szemben az ISO 639-1 kódok a nyelv natív nevén alapultak, és erős vágy volt az is, hogy ezekhez a nyelvekhez 639-2 kód (T kód) legyen, amelyek hasonlóak a megfelelő 2 karakterből álló kódhoz ISO 639-1.
- Például a német nyelv (1. rész
de
:) két kóddal rendelkezik a 2. részben:ger
(B kód) ésdeu
(T kód), míg a 2. részben csak egy kód találhatóeng
az angol nyelvre . - 2 korábbi B kódot vontak vissza, ma már csak 20 pár B/T kód marad.
A 2. részben található egyes nyelveknek mindig van kódjuk a 3. részben (ott csak a 2. rész terminológiai kódját használják fel újra), de lehet, hogy nincs kódjuk az 1. részben, amint azt a következő példák illusztrálják:
- A 3. rész
eng
megfelel a 2.eng
és az 1. részneken
- A 3. rész
ast
megfelel a 2. résznek,ast
de hiányzik belőle egy kód az 1. részben.
A 3. részben néhány kód (62) makronyelv. Ezek olyan csoportok, amelyek több egyéni nyelvet tartalmaznak, és amelyek jól megértik egymást, és általában vegyesek vagy zavarosak. Néhány makrónyelv alapértelmezett szabványos űrlapot fejlesztett ki valamelyik saját nyelvén (pl. Alapértelmezés szerint a mandarin a kínai makronyelvre vonatkozik, más nyelvek szükség esetén továbbra is megkülönböztethetők, de a cmn
mandarin speciális kódját ritkán használják).
- Az 1 makrónyelv rendelkezik a 2. rész kódjával és az 1. rész kódjával, míg a tagok egyes nyelvei az 1. és 2. részben található kódokkal is rendelkeznek:
nor
/no
tartalmaznon
/nn
,nob
/nb
; vagy - 4 makronyelv két 2. rész kóddal (B / T) és egy 1. rész kóddal rendelkezik:
per
/fas
/fa
,may
/msa
/ms
,alb
/sqi
/sq
éschi
/zho
/zh
; - 28 makronyelv rendelkezik 2. rész kóddal, de nincs 1. rész kóddal;
- 29 másik makronyelv csak kódokat tartalmaz a 3. részben.
A 2. részben található gyűjtő kódoknak van egy kódja az 5. részben: pl aus
. A 2. és 5. részben, ami az ausztrál nyelveket jelenti .
- A 2. rész egyik kollektív kódjának kódja is van az 1. részben:
bih
/bh
. - Néhány kód hozzáadásra került az 5. részben, de a 2. részben nem volt kód: pl
sqj
A 2. és 3. rész fenntartott tartományt és négy speciális kódot is tartalmaz:
- A kódok
qaa
segítségévelqtz
a helyi használatra van fenntartva. - Négy speciális kód létezik: azokhoz
mis
a nyelvekhez, amelyekhez még nincs hozzárendelve kód,mul
a "több nyelvhez",und
a "nem meghatározott" észxx
a "nincs nyelvi tartalom, nem alkalmazható" kódokhoz .
Kódtér
Alfa-2 kódtér
Az "Alpha-2" kódokat (az ISO alap latin ábécé 2 betűjéből álló kódokhoz ) az ISO 639-1 szabvány használja . Ha a nyelvek szélesebb körének kódjait kívánták, több mint 2 betűkombinációt tudtak fedezni (legfeljebb 26 2 = 676), az ISO 639-2- t alfa-3 kódok felhasználásával fejlesztették ki. (Ez utóbbit azonban hivatalosan először tették közzé.)
Alfa-3 kódtér
Az "Alpha-3" kódokat (az ISO alap latin ábécé 3 betűjéből álló kódokhoz ) az ISO 639-2 , ISO 639-3 és ISO 639-5 szabványok használják . Az így ábrázolható nyelvek és nyelvcsoportok száma 26 3 = 17.576.
Az Alpha-3 kódok közös használata az ISO 639 három részében bizonyos koordinációt igényel egy nagyobb rendszeren belül.
2. rész határozza meg a négy speciális kódok mis
, mul
, und
, zxx
, egy fenntartott tartomány qaa-qtz
(20 × 26 = 520 kódok), és 20 két- bejegyzés (a B / T kódok), plusz 2 bejegyzéseket megszüntetett B-kódok. Ez összegez 520 + 22 + 4 = 546 kódot, amelyek nem használhatók a 3. részben a nyelvek vagy az 5. részben a nyelvcsaládok vagy csoportok ábrázolására. A maradék 17 576 - 546 = 17 030.
Ma valahol hat -hétezer nyelv van a Földön. Tehát ez a 17 030 kód elegendő ahhoz, hogy minden nyelvhez egyedi kódot rendeljen, bár egyes nyelvek tetszőleges kódokkal zárulhatnak, amelyek nem hasonlítanak az adott nyelv hagyományos nevére.
Alfa-4 kódtér (visszavonva)
Az "Alpha-4" kódokat (az ISO alap latin ábécé 4 betűjéből álló kódokhoz ) javasolták használni az ISO 639-6 szabványban , amelyet visszavontak. Az ábrázolható nyelvek és nyelvjárások számának felső határa 26 4 = 456 976.
Lásd még
- IETF nyelvi címkék (ISO 639 alapján)
- ISO 3166 (országok kódjai)
- ISO 15924 ( írásrendszerek kódjai )
- Konstruált nyelvek kódjai
- Nyelvi kód
- Nyelvcsaládok és nyelvek
- Nyelvek listája
- Hivatalos nyelvek listája
- Az ISO 639 kódok listája
Jegyzetek és hivatkozások
Külső linkek
- Hivatalos ISO 639-1/RA (regisztrációs hatóság) Infoterm
- Hivatalos ISO 639-2/RA (regisztrációs hatóság) Kongresszusi Könyvtár
- Hivatalos ISO 639-3/RA (regisztrációs hatóság) SIL International
- Hivatalos ISO 693-5/RA (regisztrációs hatóság) Kongresszusi Könyvtár
- Hivatalos ISO 639-6/RA (regisztrációs hatóság) Geolang
- Közös területi adattár, amely tartalmazza az ISO 639 kódok más nyelvekre történő fordítását XML formátumban. A CLDR felmérési eszköz az adatok olvashatóbb formátumát is tartalmazza.