ISO 639 - ISO 639

ISO 639 er et sæt standarder fra Den Internationale Standardiseringsorganisation , der beskæftiger sig med repræsentation af navne til sprog og sproggrupper .

Det var også navnet på den originale standard, godkendt i 1967 (som ISO 639/R ) og trukket tilbage i 2002. ISO 639 -sættet består af fem dele.

Brug af ISO 639 -koder

Sprogkoderne defineret i de flere afsnit af ISO 639 bruges til bibliografiske formål og, i computing og internetmiljøer, som et centralt element i lokale data. Koderne finder også anvendelse i forskellige applikationer, såsom Wikipedia URL'er til dens forskellige sprogudgaver.

Nuværende og historiske dele af standarden

Standard Navn ( Koder til repræsentation af sprognavne - ... ) Registreringsmyndighed Første udgave Nuværende Nr. I liste (pr. 18. februar 2021)
ISO 639-1 Del 1: Alpha-2 kode Infoterm 1967 (som ISO 639) 2002 184
ISO 639-2 Del 2: Alpha-3 kode Congress of Library 1998 1998 482 + 20 B-kun + 4 special + 520 til lokal brug
ISO 639-3 Del 3: Alpha-3-kode til omfattende dækning af sprog SIL International 2007 2007 7.893 + 4 special + 520 til lokal brug
ISO 639-4 Del 4: Implementeringsretningslinjer og generelle principper for sprogkodning ISO / TC 37 / SC 2 2010-07-16 2010-07-16 (ikke en liste)
ISO 639-5 Del 5: Alpha-3-kode til sprogfamilier og grupper Congress of Library 2008-05-15 2013-02-11 115 (inklusive 36 resten + 29 almindelige grupper fra ISO 632-2)
ISO 639-6 Del 6: Alpha-4-repræsentation for omfattende dækning af sprogvarianter (trukket tilbage) Geolang 2009-11-17 trukket tilbage 21.000+

Hver del af standarden vedligeholdes af et vedligeholdelsesbureau, der tilføjer koder og ændrer status for koder, når det er nødvendigt. ISO 639-6 blev trukket tilbage i 2014.

Karakteristika for individuelle koder

Anvendelsesområder:

  • Individuelle sprog
  • Makrolangsprog (del 3)
  • Samlinger af sprog (del 1, 2, 5). Del 1 indeholder kun en samling ( bh), nogle samlinger var allerede i del 2, og andre blev kun tilføjet i del 5:
    • Restgrupper: 36 samlinger i både del 2 og 5 er af denne art (herunder en, der også blev kodet i del 1) - for kompatibilitet med del 2, når del 5 stadig ikke blev offentliggjort, indeholder de resterende grupper ikke noget sprog og samling der allerede var kodet i del 2 (dog kan nye applikationer, der er kompatible med del 5, behandle disse grupper inklusivt, så længe de respekterer indeslutningshierarkiet, der er offentliggjort i del 5, og de bruger den mest specifikke samling, når de grupperer sprog);
    • Regelmæssige grupper: 29 samlinger i både del 2 og 5 er af denne art - for kompatibilitet med del 2 kan de ikke indeholde andre grupper;
    • Familier: 50 nye samlinger, der kun er kodet i del 5 (inklusive en, der indeholder en almindelig gruppe, der allerede er kodet i del 2) - for kompatibilitet med del 2 kan de indeholde andre samlinger undtagen resten grupper.
  • Dialekter : De var tiltænkt at være omfattet af del 6 (foreslået, men nu trukket tilbage).
  • Særlige situationer (del 2, 3).
  • Reserveret til lokal brug (del 2, 3). Også brugt nogle gange i applikationer, der har brug for en alpha-2-kode som standardkoder i del 1 og 2 (hvor den specielle kode misikke er egnet) eller en alpha-3-kode til samlinger som standardkoder i del 5.

Typer (for individuelle sprog):

  • Levende sprog (del 2, 3) (alle makrolangsprog er levende sprog)
  • Uddøde sprog (del 2, 3) (608, 5 af dem er i del 2: chb, chg, cop, lui, sam, ingen er i del 1)
  • Oldtidssprog (Parts 1, 2, 3) (124, 19 af dem er i del 2, og 5 af dem, nemlig ave, chu, lat, pliog sanhar også en kode i del 1: ae, cu, la, pi, sa)
  • Historiske sprog (del 2, 3) (83, 16 af dem er i del 2; ingen er i del 1)
  • Kunstsprog (del 1, 2, 3) (22, 9 af dem i del 2: afh, epo, ido, ile, ina, jbo, tlh, vol, zbl, 5 af dem i del 1: eo, ia, ie, io, vo)

Individuelle sprog og makrol sprog med to forskellige alfa-3-koder i del 2:

  • Bibliografisk (nogle af dem blev forældet, ingen blev defineret i del 3): disse er ældre koder (baseret på sprognavne på engelsk).
  • Terminologisk (også defineret i del 3): Disse er de foretrukne koder (baseret på modersmålsnavne, romaniseret efter behov).
  • Alle andre (inklusive sprogsamlinger og særlige/reserverede koder) har kun en enkelt alfa-3-kode til begge anvendelser.

Forholdet mellem delene

De forskellige dele af ISO 639 er designet til at fungere sammen på en sådan måde, at ingen kode betyder én ting i en del og noget andet i en anden. Imidlertid er ikke alle sprog i alle dele, og der er en række forskellige måder, hvorpå specifikke sprog og andre elementer behandles i de forskellige dele. Dette afhænger f.eks. Om et sprog er opført i del 1 eller 2, om det har separate B/T -koder i del 2 eller er klassificeret som et makrolang i del 3 og så videre.

Disse forskellige behandlinger er detaljeret i det følgende skema. I hver gruppe af rækker (en for hvert omfang af ISO 639-3) indeholder de sidste fire kolonner koder for et repræsentativt sprog, der eksemplificerer en bestemt type relation mellem delene i ISO 639, den anden kolonne giver en forklaring på forholdet , og den første kolonne angiver antallet af elementer, der har den type relation. For eksempel er der fire elementer, der har en kode i del 1, har en B / T -kode, og er klassificeret som makrolangssprog i del 3. En repræsentant for disse fire elementer er "persisk" fa/ per/ fas.

Anvendelsesområde Antal sager Beskrivelse Eksempel på matchende koder
ISO 639-1 ISO 639-2 ISO 639-3 ISO 639-5
Individuelle sprog
("jeg")
128 Individuelle sprog er ikke en del af et makrolang, med kode i hver del 1, 2 og 3 (kun én kode i del 2).
Der er 184 tildelte koder i del 1 til individuelle sprog, makrol sprog eller grupper; træk dem talt i rækker herunder, dette efterlader: 184 - (2 "I (tidligere B/T)") - (3+11 "I") - (3+2 "I (B/T)") - (28 +4+1+1 "M") - (1 "C") = 128 koder.
da eng -
2 Individuelle sprog med kode i hver del 1, 2 og 3, der havde separate B/T-koder i del 2, men hvis B-koder blev trukket tilbage (siden 2008-06-28) og beholdt deres T-koder til alle anvendelser. Disse er: hr/ ( scr) / hrvog sr/ ( ser) / srp.
Begge er en del af det samme makrolang, der blev hbstilføjet i del 3 for også at omfatte andre nyligt kodede individuelle sprog, men koden shi del 1 blev også trukket tilbage, og den havde ingen kode defineret i del 2.
time (scr)/hrv (B/T) hrv
3 Individuelle sprog, der tilhører en makrolang i Del 3, med en enkelt kode i Del 2 og også har en kode i Del 1. Disse er: bs/ bos(del af makrolanguage hbs), nb/ nobog nn/ non(begge dele af makrolanguage no/ nor). nb nob
11 Individuelle sprog med separate B/T -koder i del 2, men ikke i nogen af ​​de særlige tilfælde i efterfølgende linjer.
Der er 20 par separate B/T -koder, der i del 2 er tildelt individuelle sprog eller makrolang; fratrækker de specielle tilfælde nedenfor, dette efterlader: 20 - (3+2 "M") - (4 "C") = 11 par koder.
de ger/deu (B/T) deu
3 Individuelle sprog med separate B/T -koder i del 2, men bogstaverne fra del 1 -koden er ikke de to første bogstaver i del 2 T -koden. Disse er: cs/ cze/ ces, mi/ mao/ mriog og sk/ slo/ slk. cs cze/ces (B/T) ces
3 Individuelle sprog i del 2 og 3 (tilhører ikke en makrolang), men der var dækket i del 1 af en kode, hvis ækvivalent i del 2 er et kollektiv. Disse er: bho, mai, og mag. (bh) bho
Ethvert andet individuelt sprog i del 2 og 3, uden kode i del 1. - ast
1 Individuelle sprog tilføjet i del 3 uden koder i del 1 og 2, men som var dækket af en makrolang i del 2 og 3 også kodet i del 1. (ar) (ara) arb
1 Et individuelt sprog i del 3, uden kode i del 2, men var dækket i del 1 af en kode, hvis ækvivalent i del 2 er en kollektiv gruppe (se posten nedenfor for denne gruppe). (bh) (bih) sck
> 7.000 Ethvert andet individuelt sprog i del 3 uden kode i del 1 og 2 (muligvis dækket i del 2 af en kollektiv kode, f.eks. nic"Niger-Kodofanian (Other)", som er en restgruppe). - (god) aaa
Makrolangsprog
("M")
28 Makrosprog i del 3, der også har koder i del 1 og 2.
Der er tildelt 62 koder i del 3 til makrolangsprog; træk dem med særlige tilfælde nedenfor, dette efterlader: 62 - (4 "B/T") - 1 - (25+1+3 "ikke i del 1") = 28 koder.
ar ara
4 Makroløb i del 3 med separate B / T -koder i del 2. Disse er: fa/ per/ fas, ms/ may/ msa, sq/ alb/ sqiog og zh/ chi/ zho. fa pr/fas (B/T) fas
1 Makrolang i del 3, der indeholder sprog, der har koder i del 1. Kun: no/ nor(indeholdende: nb/ nob, og nn/ non). ingen heller ikke
25 Makrolang i del 2 og 3, men uden kode i del 1. - bal
1 Macrolanguage i del 3, uden kode i del 2, og hvis kode i del 1 er forældet. (sh) - hbs
3 Macrolanguages i del 3, uden koder i del 1 eller 2. Disse er: bnc, kln, og luy. - - bnc
Familier og grupper (kollektivt)
("C")
1 Bihari er markeret som kollektiv og har en ISO 639-2-kode og er den eneste sproggruppe, der også har en ISO 639-1-kode (hvor alle andre koder er individuelle sprog eller reserverede). Årsagen er, at tre individuelle bihari (som er forskellige nok, at de ikke kan danne den samme macrolanguage til ISO 639-3) modtog særprægede ISO 639-2 koder ( bho, mai, mag), hvilket gjorde Bihari en rest gruppe med henblik på ISO 639-2 (indeholder sprog i gruppen undtagen disse tre). bh bih - bih
35 Restgrupper i del 2, dvs. samme kode, men forskellige sprog inkluderet. I del 2 afarefererer det til et afro-asiatisk sprog, der ikke har et individuelt sprog-id i del 2, og som ikke falder ind i de tre resterende grupper: ber"Berber (Other)", cus"Cushitic (Other)" eller sem"Semitisk (Andet)", som alle er afro-asiatiske sproggrupper. - afa afa
29 Regelmæssig gruppe i del 2, samme som sprogfamilien i del 5, ingen kode i del 1. Blandt dem var den almindelige gruppe ypki del 2 den eneste, der var blevet kodet i del 5 som en del af en anden ny almindelig gruppe i del 5, der ikke var kodet i del 2 (se nedenfor). aus aus
50 Regelmæssige grupper tilføjes kun i del 5, ikke tidligere kodet i del 1, 2 og 3. De fleste af disse nye faste grupper kan tidligere have været repræsenteret af en anden kollektiv kode i del 2 som en del af en restgruppe (f.eks. Resten gruppe inefor den nye regelmæssig gruppe sqj), undtagen 7 af dem: aav, esx, euq, hmx, jpx, urj, samt syd(en del af den nye regelmæssige gruppe urj). Den almindelige gruppe ypk(del af den nye almindelige gruppe esx) var imidlertid allerede kodet i del 2. Se hierarkiet af sproggrupper i Liste over ISO 639-5-koder . - sqj
Særlige koder
("S")
1 Tilgængelig til brug i en ensproget kontekst, hvor der kræves en individuel sprogkode, men sproget i sig selv har ingen standardkode. Et mere præcist alternativ kunne være at bruge en restgruppe fra ISO 639-2 eller en sprogfamiliekode fra ISO 639-5, medmindre andre sprog i en sådan gruppe skal udelukkes (da de er adskilt med deres egen kode) eller ingen standard kollektiv kode er egnet. Nogle applikationer foretrækker muligvis at bruge en mere specifik kode inden for dem, der er forbeholdt lokal brug. - mis -
1 Flersproget indhold (indeholder mindst to sprog i adskillelige dele). Skal bruges, når der forventes en enkelt sprogkode for hele indholdet. De enkelte sprog eller makrosprog for hver del af indholdet kan muligvis stadig være ukodede (og repræsenteres som miseller mere præcist med en kollektiv kode). mul
1 Ubestemt (indholdet indeholder nul, et eller flere sprog i vilkårlig kombination). und
1 Ingen sproglige oplysninger overhovedet (tilføjet 2006-01-11). Indholdet (f.eks. Grafik, fotos eller lyd-/videooptegnelser, der ikke inkluderer tekst på et menneskeligt sprog, eller tekniske metadata og de fleste programmeringskildekoder) kan bruges som med ethvert sprog og bør ikke oversættes (undtagen beskrivelsen, der muligvis er forbundet i separat indhold eller for ikke-væsentlige fragmenter af indholdet). zxx
Reserveret til lokal brug
("R")
20 Alpha2 koder i del 1, inden for rækkevidde qa.. qt. Disse koder anbefales ikke, men de er ikke tildelt i del 1. qa -
520 Alpha3 koder i del 2 og 3, inden for rækkevidde qaa... qtz. Disse koder kan også bruges til kollektive sprog (eller andre særlige tilfælde), men ingen standardsprogfamilier og grupper tildeles dem i del 5. - qaa

Disse forskelle skyldes følgende faktorer.

I ISO 639-2 blev to adskilte koder tildelt 22 individuelle sprog, nemlig en bibliografisk og en terminologikode (B/T-koder). B -koder blev inkluderet af historiske årsager, fordi tidligere meget brugte bibliografiske systemer brugte sprogkoder baseret på det engelske navn for sproget. I modsætning hertil var ISO 639-1-koderne baseret på det oprindelige navn på sproget, og der var også et stærkt ønske om at have 639-2-koder (T-koder) for disse sprog, der lignede den tilsvarende 2-tegnskode i ISO 639-1.

  • For eksempel har det tyske sprog (del 1 de:) to koder i del 2: ger(B -kode) og deu(T -kode), hvorimod der kun er en kode i del 2 eng,, for det engelske sprog .
  • 2 tidligere B -koder blev trukket tilbage, og i dag er der kun 20 par B/T -koder tilbage.

Individuelle sprog i del 2 har altid en kode i del 3 (kun del 2 -terminologikoden genbruges der), men de har muligvis ikke en kode i del 1, som illustreret af følgende eksempler:

  • Del 3 engsvarer til del 2 engog del 1en
  • Del 3 astsvarer til del 2, astmen mangler en kode i del 1.

Nogle koder (62) i del 3 er makrolang. Disse er grupper, der indeholder flere individuelle sprog, der har en god gensidig forståelse og ofte blandes eller forvirres. Nogle makrosprog udviklede en standardformular på et af deres individuelle sprog (f.eks. Er mandarin underforstået som standard for den kinesiske makrolang, andre individuelle sprog kan stadig skelnes, hvis det er nødvendigt, men den specifikke kode cmnfor mandarin bruges sjældent).

  • 1 makrolangssprog har en del 2 -kode og en del 1 -kode, mens dens enkelte medlemssprog også har koder i del 1 og del 2: nor/ noindeholder non/ nn, nob/ nb; eller
  • 4 makrosprog har to del 2 -koder (B / T) og en del 1 -kode: per/ fas/ fa, may/ msa/ ms, alb/ sqi/ sqog chi/ zho/ zh;
  • 28 makrolangsprog har en del 2 -kode, men ingen del 1 -kode;
  • 29 andre makrol sprog har kun koder i del 3.

Kollektive koder i del 2 har en kode i del 5: f.eks. ausI del 2 og 5, som står for australske sprog .

  • En kollektiv kode i del 2 har også en kode i del 1: bih/ bh.
  • Nogle koder blev tilføjet i del 5, men havde ingen kode i del 2: f.eks sqj

Del 2 og 3 har også et reserveret område og fire særlige koder:

  • Koder qaaigennem qtzer forbeholdt lokal brug.
  • Der er fire særlige koder: mistil sprog, der endnu ikke har nogen kode, multil "flere sprog", undtil "udefineret" og zxxtil "intet sprogligt indhold, ikke relevant".

Kodeplads

Alpha-2 kodeplads

"Alpha-2" -koder (for koder bestående af 2 bogstaver i det grundlæggende latinske ISO-alfabet ) bruges i ISO 639-1 . Når man ønskede koder til et bredere udvalg af sprog, kunne mere end 2 bogstavkombinationer dække (maksimalt 26 2 = 676), ISO 639-2 blev udviklet ved hjælp af Alpha-3-koder. (Sidstnævnte blev imidlertid formelt offentliggjort først.)

Alpha-3 kodeplads

"Alpha-3" -koder (for koder bestående af 3 bogstaver i det grundlæggende latinske ISO-alfabet ) bruges i ISO 639-2 , ISO 639-3 og ISO 639-5 . Antallet af sprog og sproggrupper, der kan repræsenteres på denne måde, er 26 3 = 17.576.

Den almindelige brug af Alpha-3-koder i tre dele af ISO 639 kræver en vis koordinering inden for et større system.

Del 2 defineres fire specielle koder mis, mul, und, zxx, et reserveret område qaa-qtz(20 × 26 = 520 koder) og har 20 dobbeltposteringer (B / T koder), plus 2 indgange med udfasede B-koder. Dette summerer op til 520 + 22 + 4 = 546 koder, der ikke kan bruges i del 3 til at repræsentere sprog eller i del 5 til at repræsentere sprogfamilier eller grupper. Resten er 17.576 - 546 = 17.030.

Der er et sted omkring seks eller syv tusinde sprog på Jorden i dag. Så disse 17.030 koder er tilstrækkelige til at tildele en unik kode til hvert sprog, selvom nogle sprog kan ende med vilkårlige koder, der ikke ligner det eller de traditionelle navne på det pågældende sprog.

Alpha-4 kodeplads (trukket tilbage)

"Alpha-4" -koder (for koder bestående af 4 bogstaver i det grundlæggende latinske ISO-alfabet ) blev foreslået brugt i ISO 639-6 , som er blevet trukket tilbage. Den øvre grænse for antallet af sprog og dialekter, der kan repræsenteres, er 26 4 = 456.976.

Se også

Noter og referencer

eksterne links