お知らせ

公開:リーフレット

「自治体DX推進とオープンデータの活用」のリーフレットについて

2021年10月13日のイベントの告知のために作成した「自治体DX推進とオープンデータの活用」のリーフレットを公開します。ここからリーフレットをダウンロードできます。

ウェブサイト上でリーフレットをみることもできます。

20210622_leaflet

発表:社会情報学会(9/12)

  • 14:15-14:20
    • 司会:本田正美(関東学院大学)
  • 14:20-14:30
    • 木村泰知(小樽商科大学)
    • 「民主制下における地方自治体の情報公開・オープンデータと情報セキュリティとの交錯に関する研究の概要」
  • 14:30-15:00
    • 本田正美(関東学院大学)
    • 「オープンデータの政策過程と情報保障としてのオープンデータ」
  • 15:00-15:30
    • 河村和徳(東北大学)・遠藤勇哉(日本学術振興会特別研究員)
    • 「ALPS処理水の海洋放出に係る心理実験ーフレーミングを意識して」
  • 15:30-16:00
    • 内田ゆず(北海学園大学)
    • 「地方議会会議録を対象とした議会活動の分析・可視化」
    • 木村泰知(小樽商科大学)内田ゆず(北海学園大学)高丸圭一(宇都宮共和大学)
    • 「地方自治体のテキストデータを活用するためのAI技術」
  • 16:00-16:15
    • 河村和徳(東北大学)
    • 「地方議会のデジタル化の論点」

報告:otaru-open.city の公開

Otaru Open Cityというサイトを作成しました。このサイトでは、小樽市が公開しているデータやドキュメントを対象として、自然言語処理の技術を用いて可視化しながら、信憑性も保つために一次情報に結びつけつつ、情報提供することを目標としています。

キーワードを含む発言から動画をスタート

小樽市議会はYouTubeで議会の様子を配信しています。今回のポイントは、その動画の字幕(書き起こし)を収集し、市長や議員の発言に含まれる頻出語句をWordCloudとして可視化しているところです。このワード(Word)をクリックすることで、ワードを含む発言から動画をスタートできます

発表:JSAI2020 高丸

[4Q3-GS-9-01] 東京都議会会議録における議案への賛否を表明する発言の分析

NTCIR-15 QA Lab-PoliInfo-2 Stance Classification Taskに向けて

〇高丸 圭一1、木村 泰知2、内田 ゆず3、佐々木 稔5、吉岡 真治4、秋葉 友良6、渋木 英潔7 (1. 宇都宮共和大学、2. 小樽商科大学、3. 北海学園大学、4. 北海道大学、5. 茨城大学、6. 豊橋技術科学大学、7. 国立情報学研究所)

キーワード:政治情報、地方議会会議録、Stance Classification 筆者らは評価型タスクNTCIR-15 QA Lab-PoliInfo-2において東京都議会会議録を対象として、議会における議員の発言から、議員が所属する会派の各議案への賛否を推定するStance Classification Taskを企画している。
例えば会議録「受動喫煙防止は、我が都議会自民党の公約であり、私自身も、ぜひ積極的に進めていただきたいと心から願う一人です。しかしながら、そのことと、今回提出された条例案がよいものかというのは別の話であり、残念ながら、この条例には問題が多く、賛成できないというのが、我が党の考えです。」という発言から「都議会自民党」は提出された議案へ「反対」を表明していることが分かる。本稿では、Stance Classification Taskの正解データの構築に向けて、議案への賛否を表明する発言の分析結果について述べる。

発表:JSAI2020 佐々木

大規模地方議会会議録の分散表現 (word2vecモデル) の公開

共通パラメータ等

パラメータ名
トークン化Comainu
size200
window5
negative5
min_count5
sg1 (skip-gram)
hs0
iter20

分散表現(Comainuで単語分割したもの)

地方議会会議録Word2vecモデル(xz圧縮 2.5GB)
日本語WikipediaWord2vecモデル(xz圧縮 2.7GB)

ダウンロード方法

http://local-politics.jp/word2vec/

(w2v と jsai2020) を入力する

参考文献

JSAI2020 [4Rin1-59] 大規模地方議会会議録の分散表現を用いた地方議会のトピック分析

〇佐々木 稔1、乙武 北斗2、木村 泰知3

(1.茨城大学、2.福岡大学、3.小樽商科大学)

キーワード:地方議会会議録、分散表現、トピック分析、データ公開

本研究では,地方議会会議録に対して,地方議会でどのような話題が議論されているかについてテキストマイニング手法を利用した分析を行う.既存研究では話題の分析を行う際に,最も適切な単語単位はどの程度なのか,大規模な都道府県議会会議録から得られた単語の分散表現が利用可能なのかについて研究が行われていない.本稿では,NTCIR14 Segmentation task で利用されたデータセットを用いて,単語分割や学習データの違いにより,トピックモデルの結果がどの程度異なるのかについて分析を行った.その結果,単語分割については,Comainu を用いたことにより,固有名詞や複合名詞を扱えるようになり,トピックの意味が理解しやすくなり,ラベル付けが容易できることを確認した.学習コーパスについては, 地方議会会議録を学習データとした分散表現を用いることで,細かな表現に対応できるこ可能性があることを確認した.しかしながら,異なる分散表現を用いたときのトピックには明確な違いを確認することができなかった.