ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • Text File 에서 UTF-8 Unicode Encoding 정보
    카테고리 없음 2012. 11. 28. 17:55
    728x90
    반응형

    보통 일반 편집기(윈도우라면 메모장)으로 편집한 텍스트파일은 인코딩정보를 담고 있지 않다. 


    그런데, 윈도우 메모장에서 유니코드 혹은 UTF-8로 저장하면 텍스트파일 앞 부분에 2~3바이트의 인코딩정보가 기록된다. 이 이유로 프로그램에서 txt, cfg, xml 또는 csv 파일을 이용할때에, 이 2~3바이트의 BOM(Byte Order Mark)가 존재하는지를 체크해야만 한다. 





    Text File 에서의 BOM

    FF FE  UCS-2LE or UTF-16LE

    FE FF  UCS-2BE or UTF-16BE

    EF BB BF  UTF-8



    XML File 에서의 BOM

    3C 00  UCS-2LE or UTF-16LE

    00 3C  UCS-2BE or UTF-16BE

    3C XX  UTF-8 (where XX is non-zero)



    html 이나, xml 에서는 좀 더 유연한 방법으로 인코딩 정보를 담는다.

    <meta http-equiv="Content-Type" content="text/html; charset=utf-8" />

    <?xml version="1.0" encoding="iso-8859-1"?>




    보다 자세한 정보, 출처 : http://codesnipers.com/?q=node/68

Designed by Tistory.