ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • 한글
    인코딩 2010. 7. 17. 21:47
    유니코드를 표현하는 5가지의 encoding(ucs2, ucs4, utf-7, utf-8, utf-16)
        ucs2
            2바이트 고정형 인코딩
            Big Endian
            Little Endian
        ucs4(MIME: UTF-32)
            4바이트 고정형 인코딩
        utf-7
            unicode 의 mail safe version
            RFC1642
            unicode 를 7bit 로 표현
        utf-8
        utf-16
            BMP (Basic Multilingual Plane) 에 들어있는 글자는 2 바이트로 표현하게 되고 그 외의 글자들은 4 바이트를 이용해서 표현

    오로지 한글만을 표현
        EucKR(MIME: EUC-KR)
            ksx1001
            ks_c_5601-1987

            8비트 방식이 일반화된 현재의 메일이나 HTML

        Unified Hangul Code(MIME: x-windows-949)
            EucKR 에 몇 가지 글자를 더 추가
            UHC
            cp949 // MS949
            바이너리 값 그대로 정렬을 시도할 경우 한글의 가나다라 순서대로 정렬되지 않는다

        iso2022-kr(MIME: ISO-2022-KR)
            EucKR 을 7bit 만 사용하며 표현
            RFC1557


    참조 사이트:

Designed by Tistory.