전체 글
-
Text File 에서 UTF-8 Unicode Encoding 정보카테고리 없음 2012. 11. 28. 17:55
보통 일반 편집기(윈도우라면 메모장)으로 편집한 텍스트파일은 인코딩정보를 담고 있지 않다. 그런데, 윈도우 메모장에서 유니코드 혹은 UTF-8로 저장하면 텍스트파일 앞 부분에 2~3바이트의 인코딩정보가 기록된다. 이 이유로 프로그램에서 txt, cfg, xml 또는 csv 파일을 이용할때에, 이 2~3바이트의 BOM(Byte Order Mark)가 존재하는지를 체크해야만 한다. Text File 에서의 BOMFF FE UCS-2LE or UTF-16LEFE FF UCS-2BE or UTF-16BEEF BB BF UTF-8 XML File 에서의 BOM3C 00 UCS-2LE or UTF-16LE00 3C UCS-2BE or UTF-16BE3C XX UTF-8 (where XX is non-zero) ht..