Google
オフコン練習帳内を検索
インターネット全体を検索

NECオフコン関連
オフコン一般
情報
トップ  >  理論編  >  A−VX - A-VXの文字コード

A−VXの文字コード

1 A−VXで使える文字

WindowsやUNIXとかで、コンピュータ内に保存しているファイルを表示したり、インターネットでサイトを表示したりすると、ときどき文字化けして、読めなかったりすることがあります。その時、文字コードを変えると正しく表示されたりします。
文字を保存したり、表示したりするのには、いろいろな文字コードがありますが、A−VXも使っている文字コードが決まっています。

A−VXの文字コードは下のようになっています。

1バイト(ANK)系コードEBCDICカナ
日本語処理系コードNEC内部コード
日本語入出力系コードJISコード(JIS C 6226)


2 1バイト系のコード

A−VXが使用している文字コードは、EBCDICカナと呼ばれるものです。 一般的には英大文字と英小文字が使用できるようになっていますが、A−VXのEBCDICは英小文字の代わりにカナ文字が使用できるようになっています。これはまだ日本語が扱えなかった昔、事務処理のためにせめてカナだけでも使用できるようにしようとしたためでしょう。
ちなみにパソコンなどで使われている文字コードはJIS8です。

3 日本語のコード

日本語は少し複雑です。
日本語入出力(キーボード入力とか)は、JISコードで行います。
一方データとしてファイルなどに格納する時には、NEC内部コード(S100内部コード、ITOS内部コード、A−VX内部コード、A−VX日本語コードetcマニュアルにより、いろいろな言葉で書かれている)に内部変換されて格納されます。JISコードとNEC内部コードとの変換は、システム内部で勝手に行われるため、使用者は全く気にする必要はありません。
このNEC内部コードは、日本語をKI/KOコードで囲む必要がないという特徴を持っています。 A−VXでは全てこのNEC内部コードで処理されています。従ってA−VXのファイルからWindowsなどのファイルに変換する場合には、NEC内部コードからSJISへの変換が必要になります。

JISコードといっても策定時期によっていくつかの種類があります。A−VXはJIS78を使っていますが、最近のパソコンはJIS90を使用しています。主に問題になるのは文字の形です。例えばパソコンのWSエミュレータを使用している場合などに、画面に表示されている文字とプリンタで印刷された文字の形が違うということが起きたりします。

4 データの変換

さてA−VXで使用していたデータをWindowsでも使用しようとすると、データ変換が必要になります。
A−VXはEBCDIC+NEC内部コード、WindowsはJIS8+SJISということで文字コードの変換が必要になりますが、これはA−VX付属のユーティリティや市販のソフトを使えば簡単にできます。何の苦労もありません。
これだけなら簡単なのですが、いくつか気をつけなければならないこともあります。

先ほどA−VXがJIS78で最近のパソコンはJIS90だと説明しましたが、変換時にこれに気をつけないと変換前のデータと変換後のデータで文字の形が異なってしまうということがおきたりします。
市販のソフトではこの辺りも変換してくれるものもあるようです。

もう1つは、外字の問題です。
A−VXで外字を使用している場合は、当然その外字をWindows側に持って行かなくてはなりません。かつデータ変換時にWindows側に割り当てた文字コードに対応するように変換する必要があります。がA−VXで外字を登録する時には特に法則も無く登録しているはずなので、簡単に変換できることは非常にまれです。外字の問題はケースバイケースで対応するしかないでしょう。

JIS90の問題も外字の問題も、主に人名であるとか会社名であるとか、細かい字体の違いが重要なデータで問題となることが多いです。

いろいろ調べたところによると、EBCDICといってもいろいろな種類があるようです。
NECのオフコンに使用しているEBCDICは、8ビットのカナ文字を追加したEBCDICカナと呼ばれているものです。このため8ビットの英小文字は使用できません。
ちなみにEBCDICが各社で拡張されて微妙に違うIBM版やHP版のEBCDICがあるように、EBCDICカナにも微妙にコードが違うNEC版や日立版やIBM版があるようです。
別名旧JIS。正式名称はJIS X 0208-1978又はJIS C 6226-1978。
JIS78の後、1983年にJISが改定(通称JIS83)されました。その後さらにJIS83をベースにJIS90という規格が作られました。JIS83で、一部の字体が変更されたり、交換されたりしています。例えば「籠」←→「篭」、「遥」←→「遙」のような感じです。
だからJIS78のパソコンやオフコンで見た文字がJIS90ので見ると違う文字ということになったりします。普通は影響は少ないのですが、これらの文字を人名などに使っている場合には問題になります。正式名はJIS X 0208-1990。
このあたりの問題はNEC製オフコンに限らずにパソコン、メインフレーム、他社オフコンなどでも発生しています。これらの問題の情報はインターネット上のあちこちのサイトに書いてあります。yahooやgoogleなどの検索サイトで「JIS90」とか「JIS78」等で検索すれば、そんなサイトが大量に見つかります。
WSエミュレータの画面に出ている文字の形と印刷された文字の形が違うのは、WSエミュレータの設定に失敗しているときに起きます。パソコン側にWSエミュレータ付属のフォントを入れて、それを使うように設定すれば、とりあえずは解決します。A−VXのデータからWindowsのデータに変換した時に起きるのならば、それはデータ変換に失敗した(JIS78とJIS90の違いを考慮せずに変換した)からです。
UNICODEなどもあります。いずれにしてもA−VXとWindowsでは文字コードが違うので変換が必要ということは同じです。
データをA−VXとWindowsで交互に変換して使用している場合、JIS78とJIS90の変換を行ったり行わなかったりすると、2種類のコード体系のデータが混在するので気をつける必要があります。
普通は間違えないだろうという気もしますが、2つの間でデータを行ったり来たりさせているうちに混乱してうっかりと操作を間違えて・・・、ということがあります。