-
Text File 에서 UTF-8 Unicode Encoding 정보카테고리 없음 2012. 11. 28. 17:55728x90반응형
보통 일반 편집기(윈도우라면 메모장)으로 편집한 텍스트파일은 인코딩정보를 담고 있지 않다.
그런데, 윈도우 메모장에서 유니코드 혹은 UTF-8로 저장하면 텍스트파일 앞 부분에 2~3바이트의 인코딩정보가 기록된다. 이 이유로 프로그램에서 txt, cfg, xml 또는 csv 파일을 이용할때에, 이 2~3바이트의 BOM(Byte Order Mark)가 존재하는지를 체크해야만 한다.
Text File 에서의 BOM
FF FE UCS-2LE or UTF-16LE
FE FF UCS-2BE or UTF-16BE
EF BB BF UTF-8
XML File 에서의 BOM
3C 00 UCS-2LE or UTF-16LE
00 3C UCS-2BE or UTF-16BE
3C XX UTF-8 (where XX is non-zero)
html 이나, xml 에서는 좀 더 유연한 방법으로 인코딩 정보를 담는다.
<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />
<?xml version="1.0" encoding="iso-8859-1"?>
보다 자세한 정보, 출처 : http://codesnipers.com/?q=node/68