ISO/IEC 8859-2 - ISO/IEC 8859-2

ISO/IEC 8859-2
MIME / IANA ISO-8859-2
Alias ​​(er) iso-ir-101, csISOLatin2, latin2, l2, IBM1111
Sprog) (se nedenunder)
Standard ECMA-94 : 1986, ISO/IEC 8859
Klassifikation Udvidet ASCII , ISO 8859
Strækker sig US-ASCII
Baseret på ISO-8859-1
Andre relaterede kodninger Windows-1250

ISO / IEC 8859-2: 1999 , Informationsteknologi - 8-bit single-byte kodede grafiske tegnsæt - Del 2: latinske alfabet No. 2 , er en del af ISO / IEC 8859 -serien af ASCII-baserede standard tegnkodninger , først udgave udgivet i 1987. Det omtales uformelt som "Latin-2". Det er generelt beregnet til centrale eller "østeuropæiske" sprog, der er skrevet i det latinske skrift. Bemærk, at ISO/IEC 8859-2 er meget forskellig fra kodeside 852 (MS-DOS Latin 2, PC Latin 2), der også kaldes "Latin-2" i tjekkiske og slovakiske regioner. Kodeside 912 er en udvidelse.

ISO-8859-2 er det foretrukne IANA -tegnsætnavn for denne standard, når det suppleres med C0- og C1-kontrolkoderne fra ISO/IEC 6429 . 0,1% af alle websider bruger ISO 8859-2 i december 2018. Microsoft har tildelt kodeside 28592 aka Windows-28592 til ISO-8859-2 i Windows. IBM tildelte kodeside 1111 til ISO 8859-2.

Windows-1250 ligner ISO-8859-2 og har alle de tegn, der kan udskrives, og mere til. Nogle få af dem omarrangeres (i modsætning til Windows-1252 , som holder alle udskrivbare tegn fra ISO-8859-1 på samme sted).

Sprogdækning

Disse kodeværdier kan bruges til følgende sprog:

Det kan også bruges til rumænsk , men det er ikke velegnet til det sprog på grund af manglende bogstaver s og t med kommaer herunder, selvom det giver s og t med lignende cedillas . Disse bogstaver blev samlet i de første versioner af Unicode -standarden, hvilket betyder, at udseendet med cedilla eller med komma blev behandlet som et glyph -valg frem for som separate tegn; skrifttyper beregnet til brug med rumænsk bør derfor i teorien have tegn med komma nedenfor ved disse kodepunkter.

Microsoft leverede ikke rigtig sådanne skrifttyper til computere, der sælges i Rumænien. Alligevel har ISO/IEC 8859-2 og Windows-1250 (med samme problem) været stærkt brugt til rumænsk. Unicode afmonterede efterfølgende kommavarianterne fra cedillavarianterne og har siden taget føringen for websider, som dog ofte har s og t med cedilla. Unicode bemærker fra 2014, at afbrydelse af bogstaverne med komma nedenfor var en fejl, der forårsagede korruption af rumænske data: allerede eksisterende data og inputmetoder ville stadig indeholde de ældre cedillakodepunkter, hvilket komplicerede tekstsøgning.

Layout af kodeside

I følgende tabel vises tegn sammen med deres tilsvarende Unicode -kodepunkter. Forskelle fra ISO-8859-1 vises med mørkere skygge oven på deres forklaringsfarver.

ISO/IEC 8859-2 (Latin-2)
_0 _1 _2 _3 _4 _5 _6 _7 _8 _9 _EN _B _C _D _E _F
0_
0
1_
16
2_
32
SP
0020
!
0021
"
0022
#
0023
$
0024
%
0025
&
0026
'
0027
(
0028
)
0029
*
002A
+
002B
,
002C
-
002D
.
002E
/
002F
3_
48
0
0030
1
0031
2
0032
3
0033
4
0034
5
0035
6
0036
7
0037
8
0038
9
0039
:
003A
;
003B
<
003C
=
003D
>
003E
?
003F
4_
64
@
0040
A
0041
B
0042
C
0043
D
0044
E
0045
F
0046
G
0047
H
0048
Jeg
0049
J
004A
K
004B
L
004C
M
004D
N
004E
O
004F
5_
80
P
0050
Q
0051
R
0052
S
0053
T
0054
U
0055
V
0056
W
0057
X
0058
Y
0059
Z
005A
[
005B
\
005C
]
005D
^
005E
_
005F
6_
96
'
0060
en
0061
b
0062
c
0063
d
0064
e
0065
f
0066
g
0067
t
0068
jeg
0069
j
006A
k
006B
l
006C
m
006D
n
006E
o
006F
7_
112
s
0070
q
0071
r
0072
s
0073
t
0074
u
0075
v
0076
w
0077
x
0078
y
0079
z
007A
{
007B
|
007C
}
007D
~
007E
8_
128
9_
144
A_
160
NBSP
00A0
Ą
0104
˘
02D8
Ł
0141
¤
00A4
Ľ
013D
Ś
015A
§
00A7
¨
00A8
Š
0160
Ş
015E
16
0164
17
0179
SHY
00AD
Ž
017D
Ż
017B
B_
176
°
00B0
±
0105
˛
02DB
ł
0142
'
00B4
ľ
013E
ś
015B
02C7
B
00B8
š
0161
ş
015F
16
0165
ź
017A
˝
02DD
¼
017E
ż
017C
C_
192
15
0154
Á
00C1
Â
00C2

0102
Ä
00C4
13
0139
Ć
0106
Ç
00C7
È
010C
É
00C9
11
0118
Ë
00CB
Ě
011A
Í
00CD
Î
00CE
Ď
010E
D_
208
Đ
0110
Ń
0143
Ň
0147
Ó
00D3
Ô
00D4
Ő
0150
Ö
00D6
×
00D7
15
0158
Ů
016E
Ú
00DA
Ű
0170
Ü
00DC
Ý
00DD
16
0162
ß
00DF
E_
224
15
0155
á
00E1
â
00E2
fra
0103
ä
00E4
ĺ
013A
ć
0107
ç
00E7
č
010D
é
00E9
ę
0119
ë
00EB
Ě
011B
i
00ED
î
00EE
ď
010F
F_
240
đ
0111
ń
0144
14
0148
ó
00F3
ô
00F4
15
0151
ö
00F6
÷
00F7
ř
0159
û
016F
ú
00FA
17
0171
ü
00FC
ý
00FD
ţ
0163
˙
02D9

  Brev  Nummer  Tegnsætning  Symbol  Andet  Udefineret

Se også

Referencer

eksterne links