文字
文字コード: 文字を表す二進数。
- 対象: 「文字」
一般に以下の3つの条件を満たす文字は同じ文字とみなして、同じ文字コードを割り当てる。
- 同じ読みを持っている。
- 同じ意味を持っている。
- 同じ起源を持っている。
字体: 文字の図形的特徴。刀と刃の違いなど
- 異体字: 相互に置換が可能な複数の字体。隣と鄰など
- 包摂(ほうせつ): 異体字などに同じ文字コードを割り当てること
- 目的: 文書のなかでの文字の指定、検索、など
- 方法: 現在標準的に使われている文字の表現方法
(より詳しい説明)
- JIS [ 033 044 102 076 160 112 163 033 050 102 ]
- (日本語)シフトJIS [ 217 356 225 361 ]
- 日本語EUC [ 276 360 312 363 ]
- Unicode(UTF-8) [ 346 203 205 345 240 261 ]
[]内は「情報」という文字をその文字コードで表現したもの。
以下は文字コードでは表さない。
- 書体: 字体の統一的特徴。明朝体とゴシック体など
- フォント: 字形、活字。Finder → Application(アプリケーション) → Font Book
- ポイント: 出版で使われる大きさの単位。1ポイントは1/72インチ。
以下のそれぞれはどの文字コードか?
授業のページの文字コードは何か? 文字コード
この文字コードは何か? 文字コード
これはどうして化け続けるのか?
森鴎外の「鴎」の旧字体を
Microsoft Word
で入力し、「別名で保存」→「書式なし(.txt)」→「保存」としてプレビューを見てみよ。
または、
テキストエディト
で入力し、「別名で保存」として、Shift JISが選べるかを見てみよ。
Unicodeという文字コードでは、日本語の「机」(desk)と中国語の「机」(機の簡体字)に同じ文字コードが割り当てられているという。
これで困ることはないのだろうか?
PCによって使える文字に違いがあるだろうか?
機種依存文字というキーワードで検索してみよう。
機種依存文字はどれか?
これをダウンロードして、Windowsのメモ帳で開いてみよ。(iMacの
ParallelsでWindowsを実行できる。)
これを、iMacのWordで開いたものと比較せよ。
携帯電話の絵文字はどのように扱われているのだろうか?
可能なら携帯電話からECCSのメールアドレスにEメールを送って調べてみよ。
日本語シフトJISや日本語EUCがあるのに、日本語Unicodeや中国語Unicodeはなぜないのか?
日本語と中国語の対訳を作りたい。どの文字コードが使えるか?
文字化けの背景を知る
アンケート
yamaguch@mail.ecc.u-tokyo.ac.jp Copyright 2011 Kazunori Yamaguchi 山口和紀@東京大学総合文化研究科