분류없음2012.11.28 17:55

보통 일반 편집기(윈도우라면 메모장)으로 편집한 텍스트파일은 인코딩정보를 담고 있지 않다. 


그런데, 윈도우 메모장에서 유니코드 혹은 UTF-8로 저장하면 텍스트파일 앞 부분에 2~3바이트의 인코딩정보가 기록된다. 이 이유로 프로그램에서 txt, cfg, xml 또는 csv 파일을 이용할때에, 이 2~3바이트의 BOM(Byte Order Mark)가 존재하는지를 체크해야만 한다. 





Text File 에서의 BOM

FF FE  UCS-2LE or UTF-16LE

FE FF  UCS-2BE or UTF-16BE

EF BB BF  UTF-8



XML File 에서의 BOM

3C 00  UCS-2LE or UTF-16LE

00 3C  UCS-2BE or UTF-16BE

3C XX  UTF-8 (where XX is non-zero)



html 이나, xml 에서는 좀 더 유연한 방법으로 인코딩 정보를 담는다.

<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />

<?xml version="1.0" encoding="iso-8859-1"?>




보다 자세한 정보, 출처 : http://codesnipers.com/?q=node/68

Posted by Jadumate

티스토리 툴바