伊藤 公一朗 『データ分析の力 因果関係に迫る思考法』
最近、仕事の中でデータを集めたり分析したりすることが多かったので、書店で目に入ったときに思わず購入。平易でわかりやすく、事例も豊富な良書。著者のご年齢を見てびっくり、当方とあまり変わらない。この分野の最先端と全体像の両方を徹底的に理解されているからこそ、こうした本が書けるのだと思う。大きく刺激を受けた。
さて、本書でまず紹介されるのはランダム化比較実験(RCT)の手法。対象者を「ランダムに」振り分け、介入するグループと介入しないグループの結果を比較することで、その介入の効果を測ることができる。要素間の因果関係(相関関係ではない)を証明するためにはこの上ない強力なツールだが、実施には一定のコストがかかる。この手法の適用範囲は極めて広範囲。オバマの大統領選の資金集めでも、どのようなウェブデザインが最も効果的かがRCTを使って検証されていたという。以前紹介したバナジーとデュフロの著書も、RCTにより導かれた開発経済学の知見をまとめたもの。
このRCTが適用できない場合に、一定の自然条件を利用して同様の実験状況を作り出す手法(「境界線」を介入有無とみなすRDデザイン、「階段状の変化」を使う集積分析、「複数期間のデータ」を使うパネルデータ分析)が紹介される。とくにRDデザインの章で、医療費の自己負担額が変わる70歳を境にして受療率が変わることを厚労省「患者統計」のデータ分析で示した先行研究を紹介するくだりは、最近たまたま同統計のデータを使って仕事をしていたこともあり、とても興味深く読んだ。
計量経済学の世界では更に多様な方法が研究されているようだが、本書で紹介されるのはここまで。それでも、データ分析の威力と注意点を当方のような一般人が理解するための入り口としては十分。更なる勉強のための参考図書も巻末に付されている。読後には、「これとあれの因果関係を証明できないか」「この因果関係が言えたら面白いのではないか」等々、以前とは違う新しいものの見方が出来るようになる。
このRCTが適用できない場合に、一定の自然条件を利用して同様の実験状況を作り出す手法(「境界線」を介入有無とみなすRDデザイン、「階段状の変化」を使う集積分析、「複数期間のデータ」を使うパネルデータ分析)が紹介される。とくにRDデザインの章で、医療費の自己負担額が変わる70歳を境にして受療率が変わることを厚労省「患者統計」のデータ分析で示した先行研究を紹介するくだりは、最近たまたま同統計のデータを使って仕事をしていたこともあり、とても興味深く読んだ。
計量経済学の世界では更に多様な方法が研究されているようだが、本書で紹介されるのはここまで。それでも、データ分析の威力と注意点を当方のような一般人が理解するための入り口としては十分。更なる勉強のための参考図書も巻末に付されている。読後には、「これとあれの因果関係を証明できないか」「この因果関係が言えたら面白いのではないか」等々、以前とは違う新しいものの見方が出来るようになる。
(2017年、光文社新書)