バグ:文字化け文字列の対応

Posted: 2013年01月14日

文字化け文字列の対応を紹介します。
以前も多少記載したけれどおさらいという事で
今回はどのようなことを気をつけるべきかを記載していきたいと思っています。



カテゴリー: バグ, プログラム | タグ: , , | コメント無し »

文字コード-ASCII

Posted: 2012年04月09日

ASCII(American Standard Code for Information Interchange)と言われてもピンとこない方もいるかもしれませんが
一般的な文字コードです。

C言語のcharはASCIIまたは、ASCIIと互換を持った文字コードの文字が使用されます。
このようにASCIIは古くから存在しており、現在も使用されています。

ASCIIコードは文字を7bitで表現するため、
記号、制御文字、アルファベット、数字のみ表現が可能です。

数値(10進) 数値(16進) 文字
48-57 30-39 0-9
65-90 41-5A A-Z
97-122 61-7A a-z

※ASCIIの文字コード表は、検索をすればより良いものが出てくると思いますので、ここでは載せません。

拡張ASCIIで8bit以上の文字が表現できるようになり
様々な文字を表現できるようになりました。

しかし拡張ASCIIは日本では
半角カタカナのみなど

アイウエオ カキクケコ サシスセソ

それぞれの地域によって7bit以降の割当たっている文字が異なるため
文字化けの原因になりました。

なぜ今のようにASCIIはすべての言語を取り込まなかったか



カテゴリー: プログラム, 文字コード | タグ: , , | コメント無し »