文字コードについて
NECのオフコンは、1バイトの文字をEBCDIC、2バイトの文字をA−VX内部コードという文字コードでファイルに保存しています。
一方、オープンのシステムは、シフトJISとかUnicodeとかいう文字コードを使っています。
オフコンのデータをオープンのシステムで使うには、文字コードの変換とかが必要になってきます。
文字コードの種類は、いくつもあるみたいだし、G1集合とか区点とか普段余り聞かないような単語も登場する。JISコードとかシフトJISとかJIS90とか、「ジス」がいろいろ出てくるけど、これらの関係は?とか、文字コード間で変換したら文字化けしたとか、同じ文字のはずなのにサーバの画面で見た文字とパソコンの画面で見た文字が違ったりする。文字コードに関する謎はたくさんあります。
私が文字コードについて勉強したものをまとめてみました。どちらかというと、自分用のメモです。ついでなのでNECのオフコンとは関係無さそうな文字コード体系についても書いています。
なにぶん、以上のように個人的に勉強してまとめたものなので、間違いはたくさんあると思います。
日本語EUCとUnicodeについては、主にインターネット上の情報で勉強したので、Googleか何かで検索して、そういったサイトに行ってもらった方が良いです。
前書き的なもの
1バイト文字系の文字コード体系の概要
 ・ASCII(アスキー)
 ・JIS7/JIS8
 ・EBCDIC (の仲間)
2バイト文字系の文字コード体系の概要
 ・JIS漢字コード
 ・1バイト文字のコードと2バイト文字のコードの区別
 ・Shift JIS(シフトJIS)
 ・JIPS
 ・NEC内部コード(A−VX内部コード)
 ・JEFとKEIS
 ・IBM漢字システム
 ・日本語EUC
 ・Unicode
文字コード体系間
NECの文字コード体系について


