文字コードについて
皆さんがコンピュータを使っていて「文字化け」という問題を経験した、あるいは聞いたことがあると思います。文字はコンピュータの内部で文字コードと呼ばれる数値として処理されます。もともとコンピュータはアメリカで発達し、ASCIIと呼ばれる文字コード(いわゆる半角英数字)が用いられてきました。
しかし、漢字など多くの文字の種類を表現するにはASCIIコードでは足らなくなったので、日本語のための文字コードが開発されることになりました。現在おもに次の3種類があります。
- JISコード・・・ASCIIと同じ7ビット文字。インターネットでメールを送る際にはこのコードを使うことが暗黙の了解になっている。
- シフトJISコード・・・Windowsなどの一般のパソコンで用いられるコード。Microsoft社で開発されたためMS漢字コードとも言う。自宅のパソコンで編集したテキストなどはこのコード形式になる。
- EUCコード・・・Extended Unix
Codeの略。主にUNIX環境下で用いられる。センターのコンピュータもこの文字コードを用いている。
ある文字コードで作成されたファイルを異なる文字コードを採用している環境で見ようとすると、文字コードの違いから文字化けが起こるのです。
最近のNetscape等インターネット関連のソフトは、文字コードを自動的に判別して(Auto-detect)表示するのが主流ですから、インターネット関連の文字化け現象はあまり経験がないかもしれません(参考:Netscapeの「表示」→「文字コードセット」)。
通常のソフト(gEdit等)は複数の文字コードに対応していないものが多いので、例えば家のパソコンで作ったテキストやHTML文書(シフトJISコード)を学校で編集する場合には、
- 文字コードを変換する、もしくは、
- 複数の文字コードに対応したソフトを使う
の2種類があります。
1.HaConvを使う
メニューの「センターメニュー」→「ユーティリティ」→「HaConv(漢字コード変換)」から起動します。
詳しくはマニュアルを参照してください。→ マニュアルページへ
2. mgeditを使う
mgeditは複数の文字コードに対応したテキストエディタです。メニューの「アプリケーション」→「mgedit」に入っています。
ファイルを「ファイル」→「開く」で開くと画面左下に文字コードが表示されます。
- .../EUCJP//・・・EUCコード
- .../ISO-2022-JP//・・・JISコード
- .../SJIS//・・・シフトJIS
編集後「ファイル」→「保存」を選択すると、元のファイルの文字コードで保存されます。
ファイルの文字コードを変換するには、
- 「ファイル」→「名前を付けて保存」を選択する
- 「ファイルの文字コード」のタブで好きな文字コードを選ぶ(上の3つ参照)
- 選択:の欄に適当な名前をつけて「了解」ボタンを押す。
使用例としては、
- 家のパソコンで作成したファイル → センターで編集 (mgeditで編集、必要あらばEUCJPで保存)
- センターで作成したファイル → 家のパソコンで編集 (mgeditでSJISで保存)
ファイルの移動にはフロッピーを使えば便利です。