「自治体DX推進とオープンデータの活用 」木村 泰知、本田 正美、河村 和徳、高丸 圭一、内田 ゆず、乙武 北斗、吐合 大祐、遠藤 勇哉 日本経済評論社
なぜ、本を書くことになったのかというと、3年半ほど前に、研究費が採択されたことが始まりです。2018年頃、セコム科学技術振興財団の特定領域研究助成に応募して、研究課題名「民主制下における地方自治体の情報公開・オープンデータ化と情報セキュリティとの交錯に関する研究」として採択されました。研究の内容は、オープンデータの活用に向けて、データ公開の技術的な課題や個人情報問題などを調査しつつ、データが公開されたら何ができるのか、法律学、政策学、情報工学の3つの観点から議論するというものでした。2019年から2021年までの3年間、共同研究者である、河村先生、本田先生、高丸先生、内田先生と一緒に進めてきました。研究チームの特徴は、法学や社会情報学を専門とする文系と呼ばれる研究者と、情報工学を専門とする理系と呼ばれる研究者による文理融合の研究体制になっていることでした。文理融合の研究チームのおかげで、私には思いつかない「本を書く」という提案をしていただき、書き始めることになりました。経験豊富な共著者の先生方に、アドバイスをもらいながら、進めてきました。感謝!
本の著者には、いつものメンバーの乙武先生にも加わってもらいました。そして、本の帯は、領域代表者でもある湯淺先生に書いてもらいました。感謝!
目次
はじめに
第1章 地方自治体におけるオープンデータの政策過程
1 オープンデータ政策の発現と展開
2 オープンデータ着手の契機
3 情報公開制度との関係性
4 官民データ活用推進基本法の影響
第2章 情報保障とオープンデータ
1 情報保障に関する政策展開
2 情報保障の基盤としてのオープンデータ
3 新型コロナウイルス感染症に関わるオープンデータの利用と情報保障
4 災害時におけるオープンデータ利用と情報保障
第3章 全国市区町村アンケート調査の結果からみるオープンデータ推進の現状と課題
1 はじめに
2 調査の概要
3 調査の結果
3.1 地方自治体における情報発信
3.2 オープンデータの推進体制
3.3 文書標準化に向けた自主的な取り組み
4 おわりに
第4章 民主主義下における地方政治コーパス構築の
課題と可能性
1 はじめに
2 地方政治コーパス構築の意義
3 全国市区町村調査から見える市区町村政治コーパス構築の可能性
3.1 調査結果から確認される現状
3.1.1 地方議会会議録のWEB公開の状況
3.1.2 議員活動時の通称使用状況
3.1.3 選挙結果のWEB公開と選挙公報の発行状況
3.2 全国市区町村調査の結果から見えるもの
4 地方政治コーパス構築に向けての提言
4.1 オープンデータ推進と政治家IDナンバーの導入
4.2 選挙公報制度の見直し
4.3 懸念される「忘れられる権利」
第5章 オープンデータとしての地方議会会議録
1 オープンデータとしての議会会議録
2 地方議会会議録と地方議会議員
2.1 会議録ウェブ公開の状況
2.2 地方議会議員の概要
3 会議録の収集とデータセットの構築
3.1 議会会議録コーパスの収集と構築
3.2 会議録の整理の考え方
3.3 会議録の整理の流れ
3.3.1 発言の抽出
3.3.2 発言者の抽出
3.4 発言者の名寄せ
3.4.1 通称(かな表記)
3.4.2 通称(芸名)
3.4.3 旧字体(異体字)
3.4.4 会議録の誤記
3.4.5 外部知識源の誤記
第6章 地方議会会議録横断検索システム「ぎ~みる」
1 「ぎ~みる」とは
2 「ぎ~みる」の概要
3 「ぎ~みる」の各機能
3.1 全文検索
3.2 KWIC検索
3.3 マップ検索
3.4 時系列検索
3.5 クロス表検索
4 使用実例
第7章 地方議会会議録コーパスの研究利用
1 はじめに
2 地方議会会議録の整文
2.1 整文とは
2.2 分析対象と調査方法
2.3 整文基準に基づく整文例の分類
2.4 レーベンシュタイン距離
2.5 考察
3 ことばに関する研究事例①:文末表現の出現分布
3.1 分析対象データの概要
3.2 フレーズ間の使用地域の相関
3.3 文末表現の出現分布
4 ことばに関する研究事例2:オノマトペ
4.1 形態素解析によるオノマトペの抽出
4.2 使用頻度の高いオノマトペ
4.3 オノマトペ使用の地域差
4.4 議会で使用されるオノマトペ
5 その他の研究事例
第8章 議会活動の分析・可視化
1 はじめに
2 発言量に関する分析
2.1 発言量の全体的傾向
2.2 議員属性別の発言量比較
2.3 議員別の発言量比較
3 発言内容に関する分析①:議員属性による比較
3.1 対数尤度比を利用した特徴語の抽出
3.2 政治語彙度を利用した政治特徴語の選別
3.3 政治特徴語の分析
4 発言内容に関する分析②:都道府県・発言期間・議員による比較
4.1 TF・IDFを利用した特徴語の抽出
4.2 都道府県別の特徴語の比較
4.3 発言期間別の特徴語の比較
4.4 議員別の特徴語の比較
第9章 政治情報に関するAI技術
1 AI技術の研究とは
1.1 タスクとデータセット
1.2 言葉を処理するAI技術の研究
1.3 地方議会と議会の構造
1.4 政治情報に関するタスク
2 政治課題の抽出
2.1 政治課題とは
2.2 政治課題の主辞
2.3 議会会議録を対象とした政治課題の抽出
3 根拠をともなう意見の抽出
3.1 根拠をともなう意見とは
3.2 クラウドソーシングによるデータ作成
4 Stance(立場)の分類
4.1 政治家のStance(立場)とは
4.2 議会だよりに記載されている賛否
5 質問と答弁の対応関係を考慮した要約
5.1 一括質問一括答弁の要約
5.2 「都議会だより」の要約
6 政治課題に関する議論
6.1 背景・過程・結果
6.2 法律に関する議論の過程と結果
6.3 予算に関する議論の過程と結果
7 まとめ
第10章 被災地の候補者は選挙で何を語ってきたのか:オープンデータとしての選挙公報を
利用した分析
1 はじめに
2 選挙公約に対する姿勢
3 データと分析手法
3.1 データ
3.2 分析手法
4 分析の結果
5 本章のまとめ
第11章 ALPS処理水の海洋放出に対する日韓国民の心理:フレーミングを意識して
1 はじめに
1.1 菅内閣の判断と韓国政府の反応
1.2 本章の目的と意義
2 仮説
3 実験デザイン
4 結果
4.1 分析の事前準備
4.2 実験の結果
4.2.1 群間で有意な違いは見られるのか
4.2.2 どのような被験者がより情報の影響を受けるのか
5 導き出される結論と議論
民主制下における情報公開・オープンデータ化と情報セキュリティとの交錯に関する研究
全国市区町村アンケート調査コードブック(N=832)