プロジェクトリーダ 木村泰知
言語分析担当 高丸圭一
実装担当 乙武北斗
言語分析担当 高丸圭一
実装担当 乙武北斗
1. 地方議会会議録検索システム
- 科研費基盤(B)で収集した地方議会会議録コーパスを横断検索できようにしたシステムです。
- 現在進めている科研費基盤(C)でもデータの追加収集を行っています。
- この検索システムには,全文検索機能,マップ検索機能(頻度のマップ表示),クロス表検索機能(年度×自治体などの頻度分布)があります。(一部未実装)
- 関係者・研究者に限定したβリリースを行っています。関心のある方はご連絡ください。
2. ログイン
- 「メールアドレス」と発行された「パスワード」の組を入力してログインしてください。
- パスワードは大切に管理してください。
- 登録されているメールアドレス宛に種々の連絡をしますので,変更された際はご連絡ください。
3. 統計情報
- 収録されている会議録のデータ量を自治体別,年度別に表示できます。
- 平成27年4月現在,2011年度までの市町村議会を中心に収録されています。
- 平成27年度中に政令指定都市等について最新データの追加収集を進めています。
4. 発言検索→シンプル検索
- 全文検索を行うことができます。
-
通常は「フレーズ完全一致」モードを選択してください。
(※「N-gram分割」モードでは部分一致も表示されます) - 複数の語句を検索する場合「AND検索」「OR検索」を切り替えることができます。
- まず上位50件の結果が表示されます。
- 「さらに結果を取得する」ボタンでさらに50件ずつ結果が表示されます。
今後実装される予定の機能
- 検索結果を一括ダウンロードする機能
- 年度,地域を限定(選択)した検索機能
-
検索で見つかった文の前後の文を見る機能
など・・・・
5. マップ検索→シンプル検索
- 全文検索の結果を都道府県単位で集計し,頻度や割合(出現確率)を地図に表示することができます。
- 「頻度を出力」モード:出現頻度を元に地図を塗ります。(※都道府県ごとに収録データ量に偏りがあるため注意が必要)
- 「割合を出力」モード:出現頻度を登録発言数(≒文数)で割った値(出現確率)を元に地図を塗ります。
- 「N-gram分割」「フレーズ完全一致」および「AND」「OR」は発言検索と同じです。
今後実装される予定の機能
-
地図から発言検索へのリンク
など・・・・