演習用データについて
データの出典
データの内容
2015年度の各都道府県ごとの人口や世帯数など14項目の統計データである。各列の内容は以下のとおりである。
- 都道府県名
- 総人口【人】
- 世帯数【世帯】
- 総面積(北方地域及び竹島を除く)【ヘクタール】
- 可住地面積【ヘクタール】
- 標準価格(住宅地平均価格)【円/平方メートル】
- 消防部門職員数【人】
- 社会福祉費(都道府県財政)【千円】
- 小学校教員数【人】
- 野球場・ソフトボール場数【施設数】
- ごみ総排出量(総量)【トン】
- 理容・美容所数【所数】
- 病院数【施設数】
- 出火件数【件数】
- 交通事故死傷者数【人】
データの読み込み方法
import csv data = [] for i in csv.reader(open('statistics.csv', encoding='sjis')): for j in range(1, len(i)): i[j] = int(i[j]) data.append(i)
演習課題例
- 適当な指標を選び、その指標での上位10都道府県・下位10都道府県を調べよ。また、人口あたり・単位面積あたりの値についても調べてみよ。
- 適当な指標をいくつか選び、回帰分析によりそれらの関係を調べてみよ。
- 適当な距離関数を設定し、都道府県をクラスタリングしてみよ。また、人口あたり・単位面積あたりのデータでクラスタリングをすると、結果は変わるだろうか?