2009-06-21から1日間の記事一覧

文字コード自動判別の個人的なメモ

流れはこんな感じだった。 BOM チェックで Unicode を判別 chardet などでエンコーディングを推定 UTF/MBCS ならデコード試行 ユーザーロケールのエンコーディングでデコード試行 chardet などでエンコーディングを推定 非 UTF/MBCS ならデコード試行 結果が…