6/20 情報の処理
最近の計算機関連のニュースから
- 迷惑メール対策に約100通分を無料化 NTTドコモ
SPAMメールはどこでもいやがられているが,携帯電話メールでは特に受信者
が末端の通信料を負担するため,携帯電話会社に対して「迷惑メールで儲てい
る」という批判がみられた.
今回の対策は,それへの対策という名目だが実質的なディスカウントをおこ
なうというもので,本質的な対策になっているとは思えない.
- ネット電話にも電話番号割り当て 総務省が方針
インターネットの常時接続が当たり前になるにしたがって,固定電話の主な
メリットはほとんど電話番号による相互接続性のみとも言えるようになってき
た.今回の動きが実現すると,固定電話のメリットの大部分は失われることに
なると考えられる.
- ヤフーがDSL市場に参入へ 月2280円で
東京メタリックの不振により,NTTの一人勝ちと思われたADSL市場に強力な対
抗馬が出現することになった.しかし,この値段では単独で黒字にするのは難
しいと考えられる.有料コンテンツや広告で元をとることを考えているのかも
しれないが,この手のビジネスモデルで過去に失敗した例は多い.
前回の補足,復習
今日の目標
- はいぱーワークブックの
「18 情報の処理」の文字列データ処理と,「22 データ処理」を自習する.
- この講義独自の課題を出すので,解答する.
はいぱーワークブックへの補足
- データ処理で使う gawk もプログラミング言語の一種であり,はいぱー
ワークブックではその一部の機能しか紹介していない.詳しく知りたい人は,
man gawk
としたり,muleの中で M-x info として,その中で gawk の infoを読めば良いが,
日本語で読みたい場合は,WWW等でawk入門のページを検索すると良い.
- user.ecc.u-tokyo.ac.jp のログファイルが年/月/日というディレクト
リの下に置かれるようになったが,はいぱーワークブックでは直っていない.
- はいぱーワークブックでは,WWWブラウザで1つ1つログファイルを取っ
てくるように指示しているが,ファイルの量が多くなり,作業の手間が大きく
なったので,6/19のログのうち,
- ユーザのトップページ(index.[s]html)へのアクセス
だけをまとめて,as303.ecc.u-tokyo.ac.jpの/var/tmp/ktanaka/toppages.log
に置いたので,それを使うように(前回の slogin を参照).ただし,皆が
as303上で作業すると,重くなるのでファイルを自分のホームディレクトリや
ux???の /tmp にコピーして ux???で作業する.
このファイルは,
wget -r http://user.ecc.u-tokyo.ac.jp/logs/access/2001/06/19
のように,wget コマンドを使って,ある1日(この例では2001年6月19日)のファ
イルをまとめて持ってきて,
cd user.ecc.u-tokkyo.ac.jp/logs/access/2001/0619
zcat ac*gz | grep 'GET /~[a-z0-9]*/index\.*html' > toppages.log
のようにして作成したものである.
- 今回の課題をこなすためには,出力を画像ファイルにする必要がある.
グラフを /home/ktanaka/jousho01/report620.ps というファイルに
Postscript形式で出力する時には,
gnuplot> set terminal postscript
Terminal type set to 'postscript'
Options are 'landscape noenhanced monochrome dashed defaultplex "Helvetica" 14'
gnuplot> set output "/home/ktanaka/jousho01/report620.ps"
のように入力してから plot 命令を実行する.ファイル名を自分のホームディ
レクトリ以下のファイル名に変更しないと実行できないので注意が必要になる.
今日の課題
注意
gnuplotで作成された Postscriptファイルには,日付や作成者の情報が残るの
で,他人が gnuplot を実行して作成した Postscript ファイルをコピーして
提出しても分かってしまう.
大量データからグラフを描くのページの gnuplotコマンドで,
plot '18May-time-syozoku' using 1:2 title 'all access(18 May)','' using 1:3 title 'a','' using 1:4 title 'c','' using 1:5 title 'e','' using 1:6 title 'g','' using 1:7 title 'j','' using 1:8 title 'l','' using 1:9 title 'm','' using 1:10 title 'n','' using 1:11 title 'p','' using 1:12 title 's','' using 1:3 title 't';
とある最後の「using 1:3」は「using 1:13」の間違い.ただし,既に提出し
てしまった人もいるので,「using 1:3」で描いたグラフも減点しない.
締切は 6/20(火)の21時