【アナリティクス14】「行政のための統計」からの脱却目指し、公的データオープン化へ…総務省

自動車 社会 行政
総務省統計局調査官上田聖氏
  • 総務省統計局調査官上田聖氏

4月10日、国内最大級のアナリティクス専門カンファレンス「Analytics2014 ‐SAS FORUM JAPAN」が開催された。

同カンファレンスでは、データを活用し経済活動を効率化するための手法が数多く紹介された。

このうち統計行政を統括する総務省統計局からは、公的統計データの沿革説明と官学の取組みを説明し、総務省の整備するデータの利用をよびかける講演がおこなわれた。登壇者は総務省統計局調査官の上田聖氏。講演タイトルは「最近の公的統計データの利用について 二次的利用の取組みと統計のオープンデータの高度化を中心に」。

日本は、海外と比較して公的データ利用の取り組みに遅れをとっていたが、ここ数年、“社会の情報基盤としての統計”を実現するための取り組みが進められている。2007年の統計法改正によりデータを利用できる層は拡大し、匿名化により利用可能となるデータの対象の種類と年次も拡大しつつある。さらに今後は「オープンデータの高度化」のためにAPIによる統計データの高度利用環境の構築、統計GIS機能の強化、オンデマンドによる統計作成機能・方策の研究を推進する意向が示された。また、今後5年間の統計行政については、さる3月25日に閣議決定された基本計画に基づく。

同基本計画は、秘匿しない調査票情報の提供におけるオンサイト利用やプログラム送付型集計・分析の実現に向けた取り組みや、匿名データの対象調査の種類や年次の追加によるサービスの拡充、オーダーメード集計における利用条件の緩和にむけた検討、そして一般用マイクロデータの提供に向けた取り組みの推進の4つを掲げる。

2007年統計法改正で高まる気運 「社会の情報基盤としての統計」へ

上田氏は、まず2007年に改正された統計法に触れながら、官学共同で推進する統計改革の概要を説明した。

改正前の統計法第15条では「何人も、指定統計を作成するために集められた調査票を、統計上の目的以外に使用してはならない」と定めるなど、目的以外の使用を厳しく禁じていた。しかし2000年代に入ると、海外ではマイクロデータ利用が進展し、こと欧米圏では匿名化情報やパブリックユースファイルなどの開発が進んだ。しかしながら日本はデータ利用のハードルが高いままであったため、“データ利用後進国”として、ビッグデータ活用がいっこうに進むことがなかった。

そこで行われたのが、統計改革だ。東京大学経済学研究科の吉川洋教授により、“行政のための統計”から“社会の情報基盤としての統計”へ変えるための改革が提唱された。

その後、2007年には統計法が改正され、マイクロデータの利用を
1. 秘匿しない調査票情報の利用を行政機関・地方公共団体・独立行政法人、これらと共同研究を行う者・(公的な)科学研究費を受けている者
2. 行政機関に特別集計を依頼する、オーダーメード集計を、学術研究を行う者・高等教育を行う者
3. 秘匿した調査票情報の利用(匿名データの利用)を、学術研究を行う者・高等教育を行う者

にする旨、法定された。

総務省も、時期を同じくして匿名データ(調査の回答を、誰の回答か分からないように加工したデータ)を開発し、2003年には実践投入を始めた。利用件数は2004年度には6件、2006年には33件と、増加傾向にある。上田氏は「匿名データは大学院生の研究の良い材料。是非利用してほしい」と呼びかけた。

ただ、現在匿名化されているのは調査されている情報のごく一部にすぎない。国勢調査、全国消費実態調査(8万世帯の家計簿)、住宅・土地統計調査(350万世帯の住宅・居住)就業構造基本調査(50万世帯の就業状況・転職)社会生活基本調査(10万人の行動)労働力調査(10万人の毎月の就業状況)だ。上田氏によれば、今後匿名化する情報の範囲を広げることが課題となるという。

さらに現在利用可能なデータとして「一般用ミクロデータ」(集計表から作成するなど、調査票情報を直接的に用いない方法により作成する擬似的なミクロデータ)も存在する。従来統計法の強い制限をうけてきた調査票情報を、高次元クロス集計し統計化することで、自由にダウンロードできるようになるという。

◆政府統計ポータルサイト「e-Stat」に新たなAPI機能を付加

その他にも総務省は「オープンデータの高度化」を掲げ、大量、多様な統計データの提供方法を次世代化し、データの高度利用を可能とするための取り組みをおこなっている。
この取組みは3つのポイントに集約される。1つはAPI機能による統計データの高度利用環境の構築。2つ目は統計GIS機能の強化、3つ目はオンデマンドによる統計作成機能・方策の研究だという。

1つ目のAPI機能による統計データの高度利用環境の構築にむけては、総務省および統計センターが昨年より、API機能導入の試行運用を開始している。政府統計の総合窓口「e-Stat」で提供している統計データを、機械判読可能な形式(XML等)で取得できるAPI(Application Programming Interface)を提供するもので、「e-Stat」がインターネットを通じて自治体、民間企業、の情報システムに自動的に反映される。これによって、ユーザー保有もしくはインターネット上のデータ等と連動させた高度な統計データ分析にも活用されうるという。今後機能やシステム負荷の検証をしながら、利用者からの意見を把握していく意向を示した。

◆今後5年間の統計行政の動向は?

今後の統計行政の基本計画内容については4点触れられた。

1つは、秘匿しない調査票情報について。調査票情報の提供におけるリモートアクセスを含むオンサイト利用やプログラム送付型集計、分析の実現に向けた検討するという。2つめに匿名データの対象調査の種類や年次の追加によるサービスの拡充。3つ目はオーダーメード集計における利用条件の緩和に向けた検討だ。最後に広く一般に提供可能な「一般用ミクロデータ」の提供にむけた取り組みを推進すること。

これら基本計画はさる3月25日に閣議決定されている。

最後に上田氏は、「新しい計画期間に入りデータ利用を一層促進したいと考えている。ぜひご活用ください」と述べ講演を締めくくった。

《北原 梨津子》

【注目の記事】[PR]

編集部おすすめのニュース

特集