JIS X 0212 - JIS X 0212
Nyelv (ek) | Szándékoznak felhasználni mellett JIS X 0208 a japán támogatást. Önmagában lényegében egyetlen nyelvet sem támogat. |
---|---|
Alapértelmezett | JIS X 0212: 1990 |
Jelenlegi állapot | Unihan forrás. A kódolt karakterkészlet nem annyira támogatott, mint a JIS X 0208 , de néha használják az EUC-JP-ben . |
Osztályozás | Kiegészítő karakterkészlet, ISO 2022 , DBCS , CJK kódolás |
Kiterjeszti | JIS X 0208 együttes használat esetén |
Kódolási formátumok |
EUC-JP ISO-2022-JP-1 |
Sikerült általa | JIS X 0213 |
Egyéb kapcsolódó kódolás (ok) | KS X 1002 |
A JIS X 0212 egy japán ipari szabvány, amely kódolt karakterkészletet határoz meg a japán nyelvű kiegészítő karakterek kódolásához. Ez a szabvány a JIS X 0208 kiegészítésére szolgál (kódszám: 952. oldal). Úgy számozott 953 vagy 5049 , mint az IBM kódlap (lásd alább).
Ez az egyik Unicode CJK Unified Ideographs forrás standardja .
Történelem
1990-ben a Japán Szabványügyi Szövetség (JSA) kiadott egy kiegészítő karakterkészletet: JIS X 0212-1990 Az információcseréhez szükséges kiegészítő japán grafikus karakterkészlet kódja (情報 交換 用 漢字 符号 - 補助 漢字, Jōhō Kōkan'yō Kanji Fugō - Hojo Kanji ) . Ez a szabvány a fő JIS X 0208 karakterkészletben rendelkezésre álló karakterek körére épült , és az e készlet lefedettségében mutatkozó hiányosságokat hivatott orvosolni.
Jellemzők
A szabvány 6067 karaktert adott meg, amely a következőket tartalmazza:
- 21 görög karakter diakritikusokkal
- 26 kelet-európai karakter diakritikus (többnyire cirill)
- 198 ábécés karakter diakritikusokkal
- 5801 kanji
Kódolások
A következő kódolásokkal vagy beágyazásokkal engedélyezik a JIS X 0212 karakterek használatát a fájlokban stb.
- az EUC-JP karaktereket három bájt képviseli, az első 0x8F, a következő kettő a 0xA1 - 0xFE tartományban van.
- az ISO 2022 alapú JIS kódolás bizonyos megvalósításaiban - ideértve az ISO-2022-JP-EXT , az ISO-2022-JP-1 és az ISO-2022-JP-2 - az "ESC $ (D" szekvenciát használják a JIS jelzésére X 0212 karakter.
A JIS X 0212 karakterek beillesztése a népszerű Shift JIS kódolásba nem lehetséges, mivel a Shift JIS nem rendelkezik elegendő fel nem osztott kódterülettel a karakterek számára.
Végrehajtások
A JIS X 0212-et az IBM 953. kódoldalnak hívja , amely szállítói kiterjesztéseket is tartalmaz. Az alternatív CCSID 5049 kizárja ezeket a kiterjesztéseket.
Mivel a JIS X 0212 karaktereket nem lehet kódolni a Shift JIS-ben, a kódolási rendszerben, amely hagyományosan uralta a japán információfeldolgozást, a karakterkészlet kevés gyakorlati megvalósítására került sor. Mint fent említettük, az Unix / Linux rendszerekben általánosan használt EUC-JP kódolható, és itt történt a legtöbb megvalósítás:
- az 1990-es évek elején az alapvető "BDF" betűtípusokat összeállították a Unix X Window rendszerben való használatra ;
- IME konverziós fájlt állítottak össze a WNN rendszerhez;
- a kterm konzolablak alkalmazást kibővítették annak támogatására;
- az Emacs és a jstevie szerkesztőket támogatták.
Számos WWW böngésző, például a Netscape / Mozilla / Firefox család, az Opera stb., Valamint a kapcsolódó alkalmazások, például a Mozilla Thunderbird támogatja a JIS X 0212 karakterek megjelenítését EUC-JP kódolással, azonban az Internet Explorer nem támogatja a JIS X 0212 karaktereket. A modern terminál emulációs csomagok, például a GNOME terminál a JIS X 0212 karaktereket is támogatják.
Az EUC kódolásban a JIS X 0212-t támogató alkalmazások a következők:
- az xjdic szótár program Unix / Linux számára;
- a WWWJDIC japán szótárkiszolgáló (azonban mivel az Internet Explorer nem támogatja a JIS X 0212 kiterjesztéseket az EUC-ben, ez a kiszolgáló bitképes grafikát küld ezekhez a karakterekhez, ha az EUC-JP módban van beállítva.)
JIS X 0212 és Unicode
A JIS X 0212-ben szereplő kandzsikat a Han egyesülés egyik forrásaként vették figyelembe, amely a kezdeti ISO 10646 / Unicode szabvány CJK- karaktereinek egységes halmazához vezetett . Az összes 5801 kanji-t beépítették.
A jövő
A fent említett alkalmazásokon kívül a JIS X 0212 szabvány gyakorlatilag halott. Belőle 2743 kanji került bele a későbbi JIS X 0213 szabványba. Hosszabb távon valószínűleg hozzájárulása az 5801 kanji lesz, amelyet beépítettek az Unicode-ba .
Lásd még
Hivatkozások
- JIS X 0212-1990: 情報 交換 用 漢字 符号 - 補助 漢字, 日本 規格 協会, 東京 (1990. október 10., 1.). (a japán szabványdokumentum)
- A japán információfeldolgozás megértése, Ken Lunde, O'Reilly & Assoc. 1993
- CJKV információfeldolgozás, Ken Lunde, O'Reilly & Assoc. 1999, 2008.