文字コードについて


皆さんがコンピュータを使っていて「文字化け」という問題を経験した、あるいは聞いたことがあると思います。文字はコンピュータの内部で文字コードと呼ばれる数値として処理されます。もともとコンピュータはアメリカで発達し、ASCIIと呼ばれる文字コード(いわゆる半角英数字)が用いられてきました。

しかし、漢字など多くの文字の種類を表現するにはASCIIコードでは足らなくなったので、日本語のための文字コードが開発されることになりました。現在おもに次の3種類があります。

  1. JISコード・・・ASCIIと同じ7ビット文字。インターネットでメールを送る際にはこのコードを使うことが暗黙の了解になっている。
  2. シフトJISコード・・・Windowsなどの一般のパソコンで用いられるコード。Microsoft社で開発されたためMS漢字コードとも言う。自宅のパソコンで編集したテキストなどはこのコード形式になる。
  3. EUCコード・・・Extended Unix Codeの略。主にUNIX環境下で用いられる。センターのコンピュータもこの文字コードを用いている。

ある文字コードで作成されたファイルを異なる文字コードを採用している環境で見ようとすると、文字コードの違いから文字化けが起こるのです。

最近のNetscape等インターネット関連のソフトは、文字コードを自動的に判別して(Auto-detect)表示するのが主流ですから、インターネット関連の文字化け現象はあまり経験がないかもしれません(参考:Netscapeの「表示」→「文字コードセット」)。

通常のソフト(gEdit等)は複数の文字コードに対応していないものが多いので、例えば家のパソコンで作ったテキストやHTML文書(シフトJISコード)を学校で編集する場合には、

  1. 文字コードを変換する、もしくは、
  2. 複数の文字コードに対応したソフトを使う
の2種類があります。

1.HaConvを使う

メニューの「センターメニュー」→「ユーティリティ」→「HaConv(漢字コード変換)」から起動します。

詳しくはマニュアルを参照してください。→ マニュアルページへ

2. mgeditを使う

mgeditは複数の文字コードに対応したテキストエディタです。メニューの「アプリケーション」→「mgedit」に入っています。

ファイルを「ファイル」→「開く」で開くと画面左下に文字コードが表示されます。

編集後「ファイル」→「保存」を選択すると、元のファイルの文字コードで保存されます。
ファイルの文字コードを変換するには、

  1. 「ファイル」→「名前を付けて保存」を選択する
  2. 「ファイルの文字コード」のタブで好きな文字コードを選ぶ(上の3つ参照)
  3. 選択:の欄に適当な名前をつけて「了解」ボタンを押す。

使用例としては、

ファイルの移動にはフロッピーを使えば便利です。