日本評価研究Vol.6 No.1 目次に戻る

日本評価研究6巻1号
The Japanese Journal of Evaluation Studies Vol. 6, No. 1

【巻頭言】

特集「エビデンスに基づく評価の試み」について


佐々木亮
 ウエスタンミシガン大学

 「エビデンスに基づく評価」(Evidence-based Evaluation)が、世界の評価研究における大きな流れになっている1 。簡単に言えば、確かに効果があるというエビデンス(証拠)が確認された介入行為を政府の策として採用してもらうことを目指す評価活動ということである2 。この背景には以下のような考え方があるとされる。
 「過去50年間にわたり、医学の分野においては、科学的に厳密なエビデンス(証拠)に基づいた公共政策により健康に関して大きな進展が見られた。これに比べて、例えば、教育、貧困削減、犯罪と司法、薬物乱用防止策といった社会政策の分野においては、エビデンス(証拠)はほとんど注目されずに施策が実施されていて、その結果、巨額な資金が使われているが、私たちの社会が本当に必要とすることに対して何ら解決策を見出せないでいる。しかしながら、いくつかの非常に効果がある社会的な介入(Intervention)がどのようなものであるかが、厳密な研究により明らかになってきている。このことは、これらの効果があると証明された介入の例を集め、広く利用されるような方策を政府がとれば、医学を変えたように社会政策においても急速な進展が見られるかも知れないということを意味している。」3
 ここに、評価活動が社会を大きく改善するポテンシャルが垣間見える。そのポテンシャルを現実のものとするためには、上記の説明にもあるように、次の3つの作業が必要だと言える。

 1.効果があると客観的に証明された介入の評価事例の産出
 2.そうした介入の事例の収集と体系化の作業
 3.広く利用されるような仕組の整備

 まず「1.効果があると客観的に証明された介入の事例の産出」であるが、これはいわゆる実験デザイン(Experimental Design)を用いるということである4 。サンプル集団を、無作為割当(例えばコインの裏表)によって2つのグループに分け、片方のグループに介入を施し、一定期間経過後に、2つのグループに現れた違いを測定する。無作為割当によって2つのグループのあらゆる要素(例えば平均身長や男女比率)が等しくなっているわけで、2つのグループに現れた差は、途中の唯一の違いである介入を実施したかしなかったかの違いによって引き起こされたと考えることができる。つまり2つのグループに現れた差は、純粋に介入の効果であると結論することができる5。評価研究の「黄金標準」(Gold Standard)と呼ばれる方法である。ただし、実験デザインによる評価事例が決して多くない社会科学分野では、それより低い質のエビデンスであっても利用せざるを得ない場合があるのが現状である(例えば回帰非連続デザインの適用など)。次に「2.そうした介入の事例の収集と体系化の作業」であるが、この作業は「システマティック・レビュー」(Systematic Review, SR)とも呼ばれる。複数の同種の評価結果を統合して、対象とした介入の効果があるのかないのかに関して一般的な結論を出す作業である。最後の「3.広く利用されるような仕組の整備」であるが、これは、収集された事例や統合化して出された結論をデータベース化して、誰でもアクセスして参照できるようにしておくという作業である。
 本特集では、医療、刑事司法、教育、ODAの分野における、上記の3つの作業の進捗状況について検証し、その検証結果を踏まえて日本での普及の可能性について議論した。最後に、一つ注意を要することがある。それは、エビデンス(証拠)に基づく評価が各分野で注目を浴びていると言っても、それは世界的な動向であり、日本ではまだまだこれからの話だという点である。著者の知る限り、日本の社会科学の諸分野において、実験デザインを用いた評価はほとんど実施されていない。日本では、医療分野、農業分野、教育心理学、および工業生産管理の分野等の限られた分野で事例が報告されているだけである。したがって、レビューのプロトコルを定め、データベース化を進めると言っても、まずは大量の評価結果(一次研究)が産出される必要がある。各論文では、日本で大量の一次研究が産出される可能性とその道筋についても議論している。そして、この特集号自体が、エビデンス(証拠)に基づく評価に関する適切な認識の定着と、大量の一次研究の産出のきっかけとなることを期待している。

注記

1 本来、evidence-based という形容辞は、EBM(evidence-based medicine)に見られるように、エビデンスによって裏付けられる対象、つまり、その有効性が評価される対象に付加されるものである。しかし、evidence-based evaluationと言う場合のevaluationは、評価対象ではなく評価行為それ自体を指している。つまり、evidence-based evaluation とは、evaluation自体がエビデンスによって裏付けられていると言うことを意味するのではなく、さまざまな分野で進展している、エビデンス重視の流れに沿った評価活動の総体を意味している。本特集では、研究者の間で使用されているevidence-based evaluationという用語を使用してはいるが、本来は、evidence-based practices and policies(エビデンスに基づいた実践と政策)あるいは、evidence-based policy-making(エビデンスに基づいた政策決定)という用語の方が、実際のエビデンスの位置づけと利用目的を適切に表現していると言える。さらに正確を期せば、evidence-based よりも、evidence-centred 、evidence-focused、あるいはevidence-informedと表現すべきだと言わざるを得ない。このように用語に関して多様な意見があるのが世界の評価研究の現状であるが、本冒頭文では、筆者(佐々木)の責任において、標記のタイトルを用いることにした。

2 あるいは逆に、確かに効果がないというエビデンスが確認された政府の介入行為を廃止するということも当然に含む。

3 連邦政府の改善を求める民間団体であるThe Council for Excellence in Governmentから資金援助を得た「エビデンスに基づいた政策を推進するための連合」(The Coalition for Evidence-based Policy)のウェブページから抜粋。
http://coexgov.securesites.net/index.php?keyword=a432fbc34d71c7

4 社会科学では、無作為割当を用いたデザインを実験デザインというが、医療分野では当該デザインを「RCT:Randomized Controlled Trials」と呼んでいる。

5 実験デザインには、ここで紹介した最も単純なデザイン以外に、より高度なデザインも存在するが、無作為割当を適用するという基本的な考え方は同じである。

 

日本評価研究Vol. 6 No.1 目次に戻る

日本評価学会トップページに戻る