確率と情報の科学

調査観察データの統計科学

因果推論・選択バイアス・データ融合

限られた調査データを用いて,いかに真の動向や因果関係を推論するか.有用な最新の方法とその考え方.

調査観察データの統計科学
著者 星野 崇宏
ジャンル 書籍 > 自然科学書 > 情報・技術
シリーズ 確率と情報の科学
刊行日 2009/07/29
ISBN 9784000069724
Cコード 3341
体裁 A5 ・ 上製 ・ カバー ・ 260頁
定価 4,180円
在庫 在庫あり
大量のデータが得られても,実験データでないことによる偏りやデータの代表性の問題を無視すると,誤った結論が導かれてしまう.本書では豊富な具体例とともに,偏りのあるデータから正しい推論を行なうための最新の方法とその考え方を示す.さらに,インターネット調査の偏りの補正やデータフュージョンについても紹介する.


■著者からのメッセージ
 本書のタイトルは「調査観察データの統計科学」である.ただし,データを得る方法としての調査研究や観察研究に関する本ではない.ここで扱う内容をおおまかにいえば「偏りのあるデータから正しい推論を行なうための統計科学」である.「偏りのあるデータ」とは統制実験,あるいは無作為に実験条件への割り当てが行なわれていない研究で得られるデータ,および無作為抽出が行なわれていないデータのことである.
 より詳しくいうならば,「実験が行なわれていない研究で得られるデータからの統計的な因果推論」(第2~4章),「偏った抽出による標本・データを用いることで生じるバイアス(=選択バイアス)の統計的調整」(第5~6章),および「複数の情報源から得られたデータを統計的に融合させて推論を行なうデータ融合(データフュージョン)」(第7章)の3つの話題について,これらすべてを以下の3つの観点

[1]欠測データとして共通の問題構造を持っていること

[2]背景情報(本書ではこれを“共変量”と呼ぶ)を積極的に利用することで欠測データの部分を無視したり,あるいは予測できる可能性があること
 
[3]推定を行なう際には線形モデルなどのパラメトリックな方法や,カーネル法などのノンパラメトリックな方法を利用するのは多くの場合うまくいかないため,両者の中間の形態であるセミパラメトリックな方法を用いるのがよいということ

から統一的に説明することが本書の目的である.選択バイアスとデータ融合の話題は統計的因果推論と同型の問題構造を有しているため,本書では特に統計的因果推論を中心に説明する.
(本書「まえがき」より一部抜粋)
第1章 序論
第2章 欠測データと因果推論
第3章 セミパラメトリック解析
第4章 共変量選択と無視できない欠測
第5章 選択バイアスとその除去
第6章 有意抽出による調査データの補正
第7章 データ融合
星野崇宏(ほしの たかひろ)
1975年生まれ.2004年東京大学大学院総合文化研究科博士課程修了.情報・システム研究機構 統計数理研究所,東京大学教養学部を経て,2008年より名古屋大学大学院経済学研究科准教授.現在,独立行政法人科学技術振興機構(JST)さきがけ「知の創生と情報社会」領域研究代表者を兼任.

書評情報

統計 2010年9月号
ページトップへ戻る