NL研究会@宮古島


第233回自然言語処理研究会

 

(7) 全地方議会会議録の横断検索に向けたデータ収集とデータ構造の検討

井原 大将 (東大), 内田 ゆず (北海学園大学), 高丸 圭一 (宇都宮共和大学), 木村 泰知(小樽商科大学), 江崎 浩 (東大)

全国には都道府県・市・特別区・町・村を合わせて,1,788の地方自治体 が存在しており,このうち約86%がウェブ上で地方議会会議録を公開している. しかしながら,ウェブ上での会議録の公開方法やデータ形式は自治体により異なっており,横断検索や集計などにおいてそれらを統一的に扱うのは難しい. そこで本稿では,収集や整理がしづらい会議録を対象として,それらのデータ収集方法と横断検索や集計が可能となるデータ構造を提案するとともに,そのデータ構造を用いることで,どのようなことが比較できるのかを述べる.

https://nl-ipsj.or.jp/2017/09/25/nl233_program/