[人間科学部情報活用基礎のトップページへ]

コード変換と表計算

文字コード

コンピュータ内部では、ひとつひとつの文字が 0 と 1 の組み合わせで表現されている。例えば、ASCII (アスキー)という文字コード体系では、「a」という文字は、「01100001」の 8 bit(= 1 byte) で表される。文字コード体系は、英語で用いるアルファベットについても複数あるが、ASCIIを標準と考えて良い。 日本語(漢字やかな)は、ふつう1文字を 16 bit (=2 byte)で表すが、パソコンでは主に3種類のコード体系が用いられている。 ここを見て、文字コードについてもう少しだけ勉強しておこう。

実は文字コードの違いだけでなく、改行コードの扱い も差がある。

発展問題

ユニコード(Unicode) という文字コードについて調べてみよ。参考資料は、 Webページもいろいろある。詳しく知りたい人は、太田昌孝著「いま日本語が危ない」丸山学芸図書。

コード変換

  1. サンプルファイル をメールに添付して、受講生の全員へメールで送付した。メールに添付されたファイルを、適当なディレクトリ内に保存せよ。ファイル名は変更しなくてよい(もちろん変更してもよいが、下記の説明でのファイル名を読み替えること)。

  2. geditを起動して、さきほど保存したファイル(temp.csv)を開いてみよ。ファイルの内容は読めるか。

  3. 次に、このファイルのアイコンをドラッグ(drag)して、 Netscape Navigatorのウィンドウ内まで持ってきてみよ(drag & drop)。今度は内容は読めたはず。これは、Netscape Navigator が文字コード(漢字コード)の変換をしてくれるからである。

  4. 文字コードの確認
    今度は、mgeditを用いてこのファイルの文字コードを確認しよう。
    mgedit を起動して、保存したファイルを開いてみよ。 先ほどのページ のmgeditの使い方を見て、どの種類の文字コードで書かれていたか確認せよ。

  5. EUCコードへの変換
    mgeditでも変換できるが、改行コードが変換されないので、HaConvを用いることにしよう。 先ほどのページ を参考にして、HaConvでEUCコードのファイルに変換して保存せよ。
    なお、このとき、改行コードも変換するために、 HaConvのパネルでいったん「詳細画面設定」をクリックして表示し、「閉じる」をクリックすること。(本センターでは、この操作をしなくて良いように検討中である)
    変換されて作られたファイル名は、 temp.csv.conv というファイル名になっているはず。
    Unixのコマンドを使える人は、Ktermの画面から 「 nkf -ed temp.csv > temp.csv.conv」などとすればよい。
    ここまでうまくできたであろうか。ファイルの変換をするときには、いやがおうでもファイル構造を意識しておかねばならない(これは、 Unix/Linuxに限らず、WindowsやMacintohsh でも同じであるが)。「ファイル構造」については、 5月7日の講義資料の真ん中あたりを参照のこと。

    再び表計算ソフト

    CSV形式のファイルを開く

    temp.csv.conv の内容は、各データ項目がカンマ記号で区切られている。この形式は、CSV(Comma Separated Value)と呼ばれ、どの表計算ソフトでも扱える。ApplixSheet で処理してみよう。

    ApplixSheetを起動し、「ファイル」メニューから「外部読込」を選択する。 enrollment.csv ファイルを選んでから、「外部読込ファイルタイプ」として「CSV」を選択してオープンする。
    (注) ApplixSheetは、CSVファイルの各行末が LF(Line Feed)コードになっていない場合、最右列の内容がすべて数字であっても、数値ではなくラベルとして処理する。

    データのソーティング

    操作方法を参考にして、データの並べ替え(ソーティング)をしてみよう。

    1. データの入っている範囲をマウスで選択して、入学者数の多い順に並べ替えてみよう。
    2. 次に、実質競争倍率として「志願者数÷入学者数」を作成し、倍率の低い順に学部を並べ替えてみよう。人間科学部は何番目であったか。

    外部保存

    ApplixSheetで作成したデータを、例えばWindows上のMicrosoft Excel などで処理したい場合には、先ほどの外部読み込みと逆方向の操作になる。全体の授業ではこれは扱わないが、 テキストファイルへの保存方法を読んで、チャレンジしてみてほしい。

    自宅にWindowsパソコンのある人は、ShiftJISコードに変換したファイルを「添付ファイルとして」メールで送付するか、フロッピーに入れて持ち帰るとよい。フロッピーの使い方は、 よく寄せられる質問の中から、 「家のパソコンでフロッピーに記録したファイルが読めないのですが? 」 をたどればよい。

    また、自宅にWindowsパソコンのない人も、CALL教室(共通教育A棟 305教室,314教室) のパソコンには、Excelが入っているので、そこでやってみるとよい。
    情報教育システムに届いたメールは、Inboxに置いてある限り、 CALLシステムでも読むことができるので、添付ファイルとして自分(xxxxx@ecs.cmc.osaka-u.ac.jp)宛にメール送信しておけば、フロッピーでデータファイルを持ち運ぶ必要はない。
    CALL教室の開放時間帯は、 情報教育システムのトップページ から「お知らせ」を参照せよ。

    ファイルの拡張子

    こちら を参照。

    今回の宿題

    描画ソフト(GIMP)と作図ソフト(ApplixGraphics)の差について、 A4用紙 1ページにまとめよ。 印刷したものを、6月2日(土)18:00までに、センター1Fのレポートボックスへ提出せよ.

    中間試験

    6月4日(月)2時限に 中間試験 を実施する。

    これまでの講義に対する 補足資料 も参考にせよ。

    期末試験日程(9月25日火曜1時限)も予定にいれておいてください。

    タイピング練習ソフト

    新しいソフトがはいりました。「センターメニュー」→「アプリケーション」から「Tuxタイピング練習」を選んでください。Enjoy!
    Last modified: Wed May 30 14:06:49 JST 2001