ISO 639-3
ISO 639-3 je třetí částí mezinárodního standardu ISO 639. Sestává ze 7 776 třípísmenných kódů světových jazyků. Jde o rozšíření standardu ISO 639-2 s cílem pokrýt všechny známé přirozené jazyky. Tato norma byla publikována Mezinárodní organizací pro normalizaci (ISO) 5. února 2007.[1]
Využití standardu se předpokládá v řadě aplikací, především v počítačových systémech, které potřebují podporovat mnoho jazyků. Standard obsahuje co možná nejúplnější výčet jazyků živých i mrtvých, starověkých i umělých, světových i menšinových, psaných i nepsaných.[1] Nezahrnuje ovšem rekonstruované jazyky jako je protoindoevropština.[2]
Množina jazyků ISO 639-3 je nadmnožinou ISO 639-1. Z ISO 639-2 pokrývá všechny individuální jazyky, ale ne skupiny jazyků; pro individuální jazyky zastoupené v ISO 639-2 je kód ISO 639-3 stejný. Pro jazyky, které mají dva různé kódy ISO 639-2 (B a T), se v ISO 639-3 používá kód T („terminologický“; to je ten, který vychází z názvu jazyka v něm samém). Normy ISO 639-1 a -2 se zaměřovaly především na důležité jazyky, častěji zastoupené ve světové literatuře.
Příklady:
jazyk | 639-1 | 639-2 (B/T) | 639-3 typ | 639-3 kód |
---|---|---|---|---|
angličtina | en | eng | individuální | eng |
němčina | de | ger/deu | individuální | deu |
arabština | ar | ara | makrojazyk | ara |
individuální | arb a jiné | |||
minnanština | — | — | individuální | nan |
Hranice mezi jazykem a dialektem je v řadě případů předmětem sporů a norma ISO 639-3 je postupně rozšiřována. K dubnu 2012 obsahuje 7776 položek.[3] Inventář jazyků je založen na několika zdrojích, mj. samostatné jazyky obsažené v ISO 639-2, moderní jazyky z Ethnologue, historické varianty, starověké jazyky a umělé jazyky od Anthony Aristara a z Linguist Listu. Další jazyky jsou doporučovány v každoročním období pro komentáře veřejnosti.
Kódový prostor
Protože každý kód je trojice malých písmen anglické abecedy, horní mez pro počet jazyků, které lze tímto způsobem reprezentovat, je 26 × 26 × 26 = 17 576. Protože je však vyloučeno užití kódů, které existují v ISO 639-2 a nebyly převzaty (4 zvláštní kódy, 520 kódů s rezervovaným využitím a 23 kódů typu B), musí se horní mez snížit na 17 030. K dalšímu snížení dojde po odečtení kódů kolekcí jazyků v ISO 639-2 a těch, které teprve budou definovány v ISO 639-5.
Makrojazyky
56 jazyků z ISO 639-2 se pro účely normy ISO 639-3 považují za „makrojazyky“,[4] které někteří uživatelé v některých kontextech považují sice za samostatný jazyk, ale jejich varianty jsou natolik lingvisticky odlišné, že mohou být v jiných kontextech také považované za samostatný jazyk.
Některé z těchto makrojazyků, např. ara (arabština, různé druhy) jsou v ISO 639-3 rozděleny (existuje zde několik kódů pro jednotlivé varianty (jazyky) daného makrojazyka; celý makrojazyk může mít také svůj vlastní kód). Jiné, např. nor (norština) měly své varianty pokryté už v ISO 639-2 (v tomto případě nno (nynorsk) a nob (bokmål)). To znamená, že některé jazyky (např. arb, spisovná arabština), které byly v ISO 639-2 považovány za dialekty jednoho jazyka (ara), jsou nyní v ISO 639-3 v určitých kontextech považovány za samostatné jazyky.
Norma se tak snaží vypořádat s variantami, které se mohou lingvisticky lišit, ale jejich uživatelé s nimi zacházejí jako se dvěma formami téhož jazyka, např. v případě diglosie.
Na příklad:
- http://www.sil.org/iso639-3/documentation.asp?id=ara (Obecná arabština, 639-2)
- http://www.sil.org/iso639-3/documentation.asp?id=arb (Spisovná arabština, 639-3)
Pro úplný seznam viz [5].
Sdružené jazyky
„Kód sdruženého jazykového prvku je identifikátor, který zastupuje skupinu samostatných jazyků, které se nepovažují za jeden jazyk v žádném kontextu.“[6] Takové kódy nezastupují žádný samostatný jazyk ani makrojazyk.
Zatímco ISO 639-2 obsahuje třípísmenné sdružené kódy jazykových rodin, které bylo možné použít pro jazyky bez vlastního kódu, do ISO 639-3 tyto sdružené kódy zahrnuty nebyly. ISO 639-3 tedy není nadmnožinou ISO 639-2.
ISO 639-5 definuje třípísmenné sdružené kódy pro jazykové rodiny a skupiny.
Zvláštní kódy
Několik kódů je vyhrazeno pro zvláštní užití u jazyků, které nemají vlastní kód:
mis | jazyk bez vlastního kódu |
mul | směs více jazyků |
und | neznámý jazyk |
zxx | nelingvistický obsah (třeba binární data) |
Kódy qaa–qtz jsou „vyhrazeny pro vlastní užití“, např. pro vymřelé jazyky na Linguist Listu.
Využití ISO 639-3
- Ethnologue, Linguist List
- Jazyková značka IETF
- Lexical Markup Framework, specifikace ISO pro reprezentaci strojově čitelných slovníků
- Navrženo jako jazykové TLD (lcTLD)[7][8]
Reference
- ↑ a b ISO 639-3 status and abstract [online]. iso.org, 2010-07-20 [cit. 2012-06-14]. Dostupné online. (anglicky)
- ↑ Types of individual languages - Ancient languages [online]. sil.org [cit. 2012-06-14]. Dostupné online. (anglicky)
- ↑ ISO 639-3 Code Set [online]. Sil.org, 2007-10-18 [cit. 2012-06-14]. Dostupné online. (anglicky)
- ↑ Scope of denotation: Macrolanguages [online]. sil.org [cit. 2012-06-14]. Dostupné online. (anglicky)
- ↑ Macrolanguage Mappings [online]. sil.org [cit. 2012-06-14]. Dostupné online. (anglicky)
- ↑ Scope of denotation: Collective languages [online]. sil.org [cit. 2012-06-14]. Dostupné online. (anglicky)
- ↑ Languages in the Root: A TLD Launch Strategy Based on ISO 639 [online]. Circleid.com, 2004-10-05 [cit. 2012-06-14]. Dostupné online. (anglicky)
- ↑ ICANN Email Archives: [gtld-strategy-draft] [online]. Forum.icann.org [cit. 2012-06-14]. Dostupné online. (anglicky)
Externí odkazy
- Registrační úřad ISO 639-3
- FAQ na stránkách americké Library of Congress
- Připravované aplikace ISO 639-3
- Linguist List – Seznam starověkých a vymřelých jazyků Archivováno 11. 6. 2011 na Wayback Machine.
- Vysvětlení Håvard Hjulstada
V tomto článku byl použit překlad textu z článku ISO 639-3 na anglické Wikipedii.