유니코드를 표현하는 5가지의 encoding(ucs2, ucs4, utf-7, utf-8, utf-16)
ucs2
2바이트 고정형 인코딩
Big Endian
Little Endian
ucs4(MIME: UTF-32)
4바이트 고정형 인코딩
utf-7
unicode 의 mail safe version
RFC1642
unicode 를 7bit 로 표현
utf-8
utf-16
BMP (Basic Multilingual Plane) 에 들어있는 글자는 2 바이트로 표현하게 되고 그 외의 글자들은 4 바이트를 이용해서 표현
오로지 한글만을 표현
EucKR(MIME: EUC-KR)
ksx1001
ks_c_5601-1987
8비트 방식이 일반화된 현재의 메일이나 HTML
Unified Hangul Code(MIME: x-windows-949)
EucKR 에 몇 가지 글자를 더 추가
UHC
cp949 // MS949
바이너리 값 그대로 정렬을 시도할 경우 한글의 가나다라 순서대로 정렬되지 않는다
iso2022-kr(MIME: ISO-2022-KR)
EucKR 을 7bit 만 사용하며 표현
RFC1557
참조 사이트: