お知らせ

出版:「自治体DX推進とオープンデータの活用 」

「自治体DX推進とオープンデータの活用 」木村 泰知、本田 正美、河村 和徳、高丸 圭一、内田 ゆず、乙武 北斗、吐合 大祐、遠藤 勇哉 日本経済評論社

日本経済評論社

Amazon

なぜ、本を書くことになったのかというと、3年半ほど前に、研究費が採択されたことが始まりです。2018年頃、セコム科学技術振興財団の特定領域研究助成に応募して、研究課題名「民主制下における地方自治体の情報公開・オープンデータ化と情報セキュリティとの交錯に関する研究」として採択されました。研究の内容は、オープンデータの活用に向けて、データ公開の技術的な課題や個人情報問題などを調査しつつ、データが公開されたら何ができるのか、法律学、政策学、情報工学の3つの観点から議論するというものでした。2019年から2021年までの3年間、共同研究者である、河村先生、本田先生、高丸先生、内田先生と一緒に進めてきました。研究チームの特徴は、法学や社会情報学を専門とする文系と呼ばれる研究者と、情報工学を専門とする理系と呼ばれる研究者による文理融合の研究体制になっていることでした。文理融合の研究チームのおかげで、私には思いつかない「本を書く」という提案をしていただき、書き始めることになりました。経験豊富な共著者の先生方に、アドバイスをもらいながら、進めてきました。感謝!

本の著者には、いつものメンバーの乙武先生にも加わってもらいました。そして、本の帯は、領域代表者でもある湯淺先生に書いてもらいました。感謝!

目次

はじめに
第1章 地方自治体におけるオープンデータの政策過程
 1 オープンデータ政策の発現と展開
 2 オープンデータ着手の契機
 3 情報公開制度との関係性
 4 官民データ活用推進基本法の影響
第2章 情報保障とオープンデータ
 1 情報保障に関する政策展開
 2 情報保障の基盤としてのオープンデータ
 3 新型コロナウイルス感染症に関わるオープンデータの利用と情報保障
 4 災害時におけるオープンデータ利用と情報保障
第3章 全国市区町村アンケート調査の結果からみるオープンデータ推進の現状と課題
 1 はじめに
 2 調査の概要
 3 調査の結果
 3.1 地方自治体における情報発信
 3.2 オープンデータの推進体制
 3.3 文書標準化に向けた自主的な取り組み
 4 おわりに
第4章 民主主義下における地方政治コーパス構築の
課題と可能性
 1 はじめに
 2 地方政治コーパス構築の意義
 3 全国市区町村調査から見える市区町村政治コーパス構築の可能性
 3.1 調査結果から確認される現状
  3.1.1 地方議会会議録のWEB公開の状況
  3.1.2 議員活動時の通称使用状況
  3.1.3 選挙結果のWEB公開と選挙公報の発行状況
 3.2 全国市区町村調査の結果から見えるもの
 4 地方政治コーパス構築に向けての提言
 4.1 オープンデータ推進と政治家IDナンバーの導入
 4.2 選挙公報制度の見直し
 4.3 懸念される「忘れられる権利」
第5章 オープンデータとしての地方議会会議録
 1 オープンデータとしての議会会議録
 2 地方議会会議録と地方議会議員
 2.1 会議録ウェブ公開の状況
 2.2 地方議会議員の概要
 3 会議録の収集とデータセットの構築
 3.1 議会会議録コーパスの収集と構築
 3.2 会議録の整理の考え方
 3.3 会議録の整理の流れ
  3.3.1 発言の抽出
  3.3.2 発言者の抽出
 3.4 発言者の名寄せ
  3.4.1 通称(かな表記)
  3.4.2 通称(芸名)
  3.4.3 旧字体(異体字)
  3.4.4 会議録の誤記
  3.4.5 外部知識源の誤記
第6章 地方議会会議録横断検索システム「ぎ~みる」
 1 「ぎ~みる」とは
 2 「ぎ~みる」の概要
 3 「ぎ~みる」の各機能
 3.1 全文検索
 3.2 KWIC検索
 3.3 マップ検索
 3.4 時系列検索
 3.5 クロス表検索
 4 使用実例
第7章 地方議会会議録コーパスの研究利用
 1 はじめに
 2 地方議会会議録の整文
 2.1 整文とは
 2.2 分析対象と調査方法
 2.3 整文基準に基づく整文例の分類
 2.4 レーベンシュタイン距離
 2.5 考察
 3 ことばに関する研究事例①:文末表現の出現分布
 3.1 分析対象データの概要
 3.2 フレーズ間の使用地域の相関
 3.3 文末表現の出現分布
 4 ことばに関する研究事例2:オノマトペ
 4.1 形態素解析によるオノマトペの抽出
 4.2 使用頻度の高いオノマトペ
 4.3 オノマトペ使用の地域差
 4.4 議会で使用されるオノマトペ
 5 その他の研究事例
第8章 議会活動の分析・可視化
 1 はじめに
 2 発言量に関する分析
 2.1 発言量の全体的傾向
 2.2 議員属性別の発言量比較
 2.3 議員別の発言量比較
 3 発言内容に関する分析①:議員属性による比較
 3.1 対数尤度比を利用した特徴語の抽出
 3.2 政治語彙度を利用した政治特徴語の選別
 3.3 政治特徴語の分析
 4 発言内容に関する分析②:都道府県・発言期間・議員による比較
 4.1 TF・IDFを利用した特徴語の抽出
 4.2 都道府県別の特徴語の比較
 4.3 発言期間別の特徴語の比較
 4.4 議員別の特徴語の比較
第9章 政治情報に関するAI技術
 1 AI技術の研究とは
 1.1 タスクとデータセット
 1.2 言葉を処理するAI技術の研究
 1.3 地方議会と議会の構造
 1.4 政治情報に関するタスク
 2 政治課題の抽出
 2.1 政治課題とは
 2.2 政治課題の主辞
 2.3 議会会議録を対象とした政治課題の抽出
 3 根拠をともなう意見の抽出
 3.1 根拠をともなう意見とは
 3.2 クラウドソーシングによるデータ作成
 4 Stance(立場)の分類
 4.1 政治家のStance(立場)とは
 4.2 議会だよりに記載されている賛否
 5 質問と答弁の対応関係を考慮した要約
 5.1 一括質問一括答弁の要約
 5.2 「都議会だより」の要約
 6 政治課題に関する議論
 6.1 背景・過程・結果
 6.2 法律に関する議論の過程と結果
 6.3 予算に関する議論の過程と結果
 7 まとめ
第10章 被災地の候補者は選挙で何を語ってきたのか:オープンデータとしての選挙公報を
利用した分析
 1 はじめに
 2 選挙公約に対する姿勢
 3 データと分析手法
 3.1 データ
 3.2 分析手法
 4 分析の結果
 5 本章のまとめ
第11章 ALPS処理水の海洋放出に対する日韓国民の心理:フレーミングを意識して
 1 はじめに
 1.1 菅内閣の判断と韓国政府の反応
 1.2 本章の目的と意義
 2 仮説
 3 実験デザイン
 4 結果
 4.1 分析の事前準備
 4.2 実験の結果
  4.2.1 群間で有意な違いは見られるのか
  4.2.2 どのような被験者がより情報の影響を受けるのか
 5 導き出される結論と議論

民主制下における情報公開・オープンデータ化と情報セキュリティとの交錯に関する研究
全国市区町村アンケート調査コードブック(N=832)

公開:リーフレット

「自治体DX推進とオープンデータの活用」のリーフレットについて

2021年10月13日のイベントの告知のために作成した「自治体DX推進とオープンデータの活用」のリーフレットを公開します。ここからリーフレットをダウンロードできます。

ウェブサイト上でリーフレットをみることもできます。

20210622_leaflet

発表:社会情報学会(9/12)

  • 14:15-14:20
    • 司会:本田正美(関東学院大学)
  • 14:20-14:30
    • 木村泰知(小樽商科大学)
    • 「民主制下における地方自治体の情報公開・オープンデータと情報セキュリティとの交錯に関する研究の概要」
  • 14:30-15:00
    • 本田正美(関東学院大学)
    • 「オープンデータの政策過程と情報保障としてのオープンデータ」
  • 15:00-15:30
    • 河村和徳(東北大学)・遠藤勇哉(日本学術振興会特別研究員)
    • 「ALPS処理水の海洋放出に係る心理実験ーフレーミングを意識して」
  • 15:30-16:00
    • 内田ゆず(北海学園大学)
    • 「地方議会会議録を対象とした議会活動の分析・可視化」
    • 木村泰知(小樽商科大学)内田ゆず(北海学園大学)高丸圭一(宇都宮共和大学)
    • 「地方自治体のテキストデータを活用するためのAI技術」
  • 16:00-16:15
    • 河村和徳(東北大学)
    • 「地方議会のデジタル化の論点」

報告:otaru-open.city の公開

Otaru Open Cityというサイトを作成しました。このサイトでは、小樽市が公開しているデータやドキュメントを対象として、自然言語処理の技術を用いて可視化しながら、信憑性も保つために一次情報に結びつけつつ、情報提供することを目標としています。

キーワードを含む発言から動画をスタート

小樽市議会はYouTubeで議会の様子を配信しています。今回のポイントは、その動画の字幕(書き起こし)を収集し、市長や議員の発言に含まれる頻出語句をWordCloudとして可視化しているところです。このワード(Word)をクリックすることで、ワードを含む発言から動画をスタートできます

発表:JSAI2020 高丸

[4Q3-GS-9-01] 東京都議会会議録における議案への賛否を表明する発言の分析

NTCIR-15 QA Lab-PoliInfo-2 Stance Classification Taskに向けて

〇高丸 圭一1、木村 泰知2、内田 ゆず3、佐々木 稔5、吉岡 真治4、秋葉 友良6、渋木 英潔7 (1. 宇都宮共和大学、2. 小樽商科大学、3. 北海学園大学、4. 北海道大学、5. 茨城大学、6. 豊橋技術科学大学、7. 国立情報学研究所)

キーワード:政治情報、地方議会会議録、Stance Classification 筆者らは評価型タスクNTCIR-15 QA Lab-PoliInfo-2において東京都議会会議録を対象として、議会における議員の発言から、議員が所属する会派の各議案への賛否を推定するStance Classification Taskを企画している。
例えば会議録「受動喫煙防止は、我が都議会自民党の公約であり、私自身も、ぜひ積極的に進めていただきたいと心から願う一人です。しかしながら、そのことと、今回提出された条例案がよいものかというのは別の話であり、残念ながら、この条例には問題が多く、賛成できないというのが、我が党の考えです。」という発言から「都議会自民党」は提出された議案へ「反対」を表明していることが分かる。本稿では、Stance Classification Taskの正解データの構築に向けて、議案への賛否を表明する発言の分析結果について述べる。

発表:JSAI2020 佐々木

大規模地方議会会議録の分散表現 (word2vecモデル) の公開

共通パラメータ等

パラメータ名
トークン化Comainu
size200
window5
negative5
min_count5
sg1 (skip-gram)
hs0
iter20

分散表現(Comainuで単語分割したもの)

地方議会会議録Word2vecモデル(xz圧縮 2.5GB)
日本語WikipediaWord2vecモデル(xz圧縮 2.7GB)

ダウンロード方法

http://local-politics.jp/word2vec/

(w2v と jsai2020) を入力する

参考文献

JSAI2020 [4Rin1-59] 大規模地方議会会議録の分散表現を用いた地方議会のトピック分析

〇佐々木 稔1、乙武 北斗2、木村 泰知3

(1.茨城大学、2.福岡大学、3.小樽商科大学)

キーワード:地方議会会議録、分散表現、トピック分析、データ公開

本研究では,地方議会会議録に対して,地方議会でどのような話題が議論されているかについてテキストマイニング手法を利用した分析を行う.既存研究では話題の分析を行う際に,最も適切な単語単位はどの程度なのか,大規模な都道府県議会会議録から得られた単語の分散表現が利用可能なのかについて研究が行われていない.本稿では,NTCIR14 Segmentation task で利用されたデータセットを用いて,単語分割や学習データの違いにより,トピックモデルの結果がどの程度異なるのかについて分析を行った.その結果,単語分割については,Comainu を用いたことにより,固有名詞や複合名詞を扱えるようになり,トピックの意味が理解しやすくなり,ラベル付けが容易できることを確認した.学習コーパスについては, 地方議会会議録を学習データとした分散表現を用いることで,細かな表現に対応できるこ可能性があることを確認した.しかしながら,異なる分散表現を用いたときのトピックには明確な違いを確認することができなかった.