会議録の横断検索

プロジェクトリーダ 木村泰知
言語分析担当 高丸圭一
実装担当 乙武北斗

1. 地方議会会議録検索システム

  • 科研費基盤(B)で収集した地方議会会議録コーパスを横断検索できようにしたシステムです。
  • 現在進めている科研費基盤(C)でもデータの追加収集を行っています。
  • この検索システムには,全文検索機能,マップ検索機能(頻度のマップ表示),クロス表検索機能(年度×自治体などの頻度分布)があります。(一部未実装)
  • 関係者・研究者に限定したβリリースを行っています。関心のある方はご連絡ください。

2. ログイン

  • 「メールアドレス」と発行された「パスワード」の組を入力してログインしてください。
  • パスワードは大切に管理してください。
  • 登録されているメールアドレス宛に種々の連絡をしますので,変更された際はご連絡ください。

fig1

 

 

3. 統計情報

 

 

  • 収録されている会議録のデータ量を自治体別,年度別に表示できます。
  • 平成27年4月現在,2011年度までの市町村議会を中心に収録されています。
  • 平成27年度中に政令指定都市等について最新データの追加収集を進めています。

fig2

 

 

4. 発言検索→シンプル検索

 

 

  • 全文検索を行うことができます。
  • 通常は「フレーズ完全一致」モードを選択してください。
    (※「N-gram分割」モードでは部分一致も表示されます)
  • 複数の語句を検索する場合「AND検索」「OR検索」を切り替えることができます。
  • まず上位50件の結果が表示されます。
  • 「さらに結果を取得する」ボタンでさらに50件ずつ結果が表示されます。

fig3

今後実装される予定の機能

  • 検索結果を一括ダウンロードする機能
  • 年度,地域を限定(選択)した検索機能
  • 検索で見つかった文の前後の文を見る機能
       など・・・・

5. マップ検索→シンプル検索

  • 全文検索の結果を都道府県単位で集計し,頻度や割合(出現確率)を地図に表示することができます。
  • 「頻度を出力」モード:出現頻度を元に地図を塗ります。(※都道府県ごとに収録データ量に偏りがあるため注意が必要)
  • 「割合を出力」モード:出現頻度を登録発言数(≒文数)で割った値(出現確率)を元に地図を塗ります。
  • 「N-gram分割」「フレーズ完全一致」および「AND」「OR」は発言検索と同じです。

fig4

今後実装される予定の機能

  • 地図から発言検索へのリンク
       など・・・・