演習用データについて
データの出典
データの内容
世界の様々な国における、1965年、1990年、2015年での総死亡者数と死因上位10件の人数を収集したもの。
1列目が死因、2列目が死者数(一行目については総数)である。
1列目が死因、2列目が死者数(一行目については総数)である。
- チリ:1965年, 1990年, 2015年
- フランス:1965年, 1990年, 2015年
- 日本:1965年, 1990年, 2015年
- モーリシャス:1965年, 1990年, 2015年
- ニュージーランド:1965年, 1990年, 2015年
- シンガポール:1965年, 1990年, 2015年
- アメリカ合衆国:1965年, 1990年, 2015年
データの読み込み方法
一例だが、以下のプログラムを実行することで、変数dataに二次元配列としてChile_1965.csvの内容を読み込むことができる。
import csv data = [] for i in csv.reader(open('Chile_1965.csv')): i[1] = int(i[1]) data.append(i)
演習課題例
- 適当な国を選び、死因ごとの死者数の推移をグラフにしてみよ。
- 適当な距離関数を設定し、データをクラスタリングしてみよ。同じ時期のデータは同じクラスタになるだろうか? それとも同じ国のデータが同じクラスタになるだろうか?