木村泰知

NTCIR QALab-PoliInfo kickoff meeting @ NII

 

NTCIR-14 QALab-PoliInfo キックオフミーティング @ NII
https://poliinfo.github.io/

第4回目となるQALab4は,QALab-PoliInfoという名前になり,地方議会会議録を利用するタスクとなりました.今回から,木村は,オーガナイザーになったので,理研AIPでのアドバイスも反映させつつ,具体的なタスクの内容を考えています.

今日のキックオフミーティング には約20名が参加してくれました.参加してくれたみなさん,ありがとうございました!みなさんの意見を活かして,魅力的なタスクになるように,がんばりまーす.

 

 

 

記者レク@札幌サテライト

都道府県議会会議録に正確な発言者情報を付与した研究成果の発表をすることにしました.

そのための準備は,記者クラブへのプレスリリースの投げ込みから始まります.

そのプレスリリースの流れを下記に示します(誰かの役に立てれば幸いです).

 

Step1 プレスリリースの準備(小樽商科大学には小樽商科大学フォーマットがあります)

Step2 記者クラブへの投げ込み

今回,投げ込みをするときに,初めて知ったのですが,札幌市には記者クラブがいくつも存在するようです.投げ込みした記者クラブは,小樽市の記者者クラブ、北海道庁 道政記者クラブ、北海道経済記者クラブです.各記者クラブには,20社ぐらいの報道機関があるので,ニュースリリースの用紙を50枚ほど印刷してもらいました.

 

Step3 記者の前での説明

今回は,概要を木村が説明し,詳細を内田先生に説明してもらいました.

 

Step4 掲載するか,掲載しないかは,記者の判断による.

(あとは待つだけ)

 

都道府県議会議員の発言量

概要

地方議会会議録コーパス中の各発言には発言者情報(氏名・選挙区・生年・性別)が付与されています。つまり、都道府県議会でいつ・どこで・だれが・なにを発言しているのかがわかります。これらの情報を利用すると、以下のような疑問に答えることができます。

Q. 全国の都道府県議会には何人の議員がいるの?

Q. 議員の年齢・性別構成は?

Q. 議会で活発に発言しているのはどの層の議員?

Q. 議員の性別によって発言内容に違いはあるの?

Q. 議員の年齢層によって発言内容に違いはあるの?

調査

以下のデータを対象として、議員の数や発言文字数を調査しました。

  • 対象期間:平成23年4月~平成27年3月
  • 対象会議:都道府県議会の本会議

1. 都道府県議会議員の年齢・性別構成

※年齢は平成23年12月31日時点のものです。

日本では国会の女性議員比率が低い*ことが知られています。地方議会においても女性議員は男性議員の1/10程度にとどまり、同様の傾向が見られました。

*衆議院9.5%、参議院15.7%(2016年1月時点)

 

2. 都道府県議会議員の属性別平均発言文字数

※年齢は平成23年12月31日時点のものです。

65~84歳の男性議員が最も発言文字数が少なく、45~64歳の女性議員が最も発言数が多いという結果になりました。また、どの年齢層でも男性議員よりも女性議員の方が多く発言しています。ただし、女性議員の人数は非常に少ないため、本会議全体に占める発言の割合は決して多くありません。

この調査では単純に発言文字数のみを比較していますので、この結果からすぐに「女性議員の方が活発に発言している」と結論付けることはできません。女性の方が丁寧な表現を使用するため発言が長くなっているとも考えられます。

 

3. キーワードの平均発言回数(性別で比較)

上のグラフは、各キーワードにおいて「男性議員を1とした時の女性議員の発言回数」を示しています。
女性議員が「増税」というキーワードを発言する回数は、男性議員の4.4倍にのぼります。その他、「貧困」「消費税」「年金」「保育」など、生活に密着した話題は女性議員の得意分野のようです。

 

4. キーワードの平均発言回数(年齢層で比較)

上のグラフは、各キーワードにおいて「45-64歳の年齢層を1とした時の他の年齢層の発言回数」を示しています。
若い議員ほど「インターネット」というキーワードを多く発言していることがわかります。「待機児童」「保育」「英語」も同じ傾向が見られます。25~44歳の議員は子育て世代を代表した発言が多いようです。45~64歳の議員は「年金」「介護保険」「消費税」などに関心が高そうです。働き盛り世代ならではの特徴でしょうか。

 

5. 都道府県別の発言量の比較

上のグラフは各都道府県の本会議における総発言文字数を示しています。議員以外(知事や職員)の発言も含まれますが、発言量のおおよその目安にはなるでしょう。

 

このように、地方議会会議録コーパスを利用すると、都道府県議会議員の活動の一端を可視化することができます。

 

地国プロジェクト@国研

二階堂先生チームの研究会が,国立国語研究所で開催されました.

 

飲み会の雑談から始まった「地国プロジェクト」についての発表です.

地国プロジェクトでは,地方議会と国会議会の会議録を対象に比較分析を行います.

http://www.ninjal.ac.jp/event/specialists/project-meeting/m-2017/20171210-16/

  • 「会議録コーパスの活用方法の検討 ―議員の活動を可視化するために―」
    内田 ゆず (北海学園大学 准教授),木村 泰知 (小樽商科大学 准教授),高丸 圭一 (宇都宮共和大学 准教授)

    議員の活動の実態を明らかにするために会議録を活用する方法を模索している。
    分析の観点として,議員の属性 (性別や年代,当選回数),会議の場 (地方議会/国会,本会議/委員会),議員の発言回数などが考えられる。
    発表では,これまでの分析で得られたいくつかの事例を紹介する。

 

研究発表会「議会会議録を活用した日本語のスタイル変異研究」
日時2017年 12月 10日 (日曜日)
場所国立国語研究所 (地図)
説明時間 : 10:00-16:00
会場 : 3階 セミナー室

NL研究会@宮古島


第233回自然言語処理研究会

 

(7) 全地方議会会議録の横断検索に向けたデータ収集とデータ構造の検討

井原 大将 (東大), 内田 ゆず (北海学園大学), 高丸 圭一 (宇都宮共和大学), 木村 泰知(小樽商科大学), 江崎 浩 (東大)

全国には都道府県・市・特別区・町・村を合わせて,1,788の地方自治体 が存在しており,このうち約86%がウェブ上で地方議会会議録を公開している. しかしながら,ウェブ上での会議録の公開方法やデータ形式は自治体により異なっており,横断検索や集計などにおいてそれらを統一的に扱うのは難しい. そこで本稿では,収集や整理がしづらい会議録を対象として,それらのデータ収集方法と横断検索や集計が可能となるデータ構造を提案するとともに,そのデータ構造を用いることで,どのようなことが比較できるのかを述べる.

https://nl-ipsj.or.jp/2017/09/25/nl233_program/

 

 

人工知能学会全国大会@名古屋

JSAI2017


2017年度 人工知能学会全国大会(第31回)
http://www.ai-gakkai.or.jp/jsai2017/

日程:
    2017年5月23日(火)~ 5月26日(金)
会場:
    ウインクあいち(愛知県産業労働センター)
    愛知県名古屋市中村区名駅4丁目4-38(名古屋駅から徒歩約5分)
    
発表資料 「3G2 Webマイニング「Webマイニング‐Webマイニング応用」」
https://kaigi.org/jsai/webprogram/2017/session-318.html

3G2-2 都道府県議会会議録を対象とした議題・議案表現の自動抽出に向けた検討

  1. 田中 琢真(豊橋技術科学大学大学院工学研究科情報・知能工学専攻)
  2. 小林 暁雄(豊橋技術科学大学大学院工学研究科情報・知能工学専攻)
  3. 坂地 泰紀(成蹊大学理工学部情報科学科)
  4. 内田 ゆず(北海学園大学工学部電子情報工学科)
  5. 乙武 北斗(福岡大学 工学部 電子情報工学科)
  6. 高丸 圭一(宇都宮共和大学 シティライフ学部)
  7. 木村 泰知(小樽商科大学 商学部社会情報学科)
  8. 増山 繁(豊橋技術科学大学大学院工学研究科情報・知能工学専攻)


3G2-4 議論の背景・過程・結果を関連づける地方政治コーパスの構築の試み

  1. 木村 泰知(小樽商科大学 商学部社会情報学科)
  2. 小林 暁雄(豊橋技術科学大学大学院工学研究科情報・知能工学専攻)
  3. 坂地 泰紀(成蹊大学理工学部情報科学科)
  4. 内田 ゆず(北海学園大学工学部電子情報工学科)
  5. 高丸 圭一(宇都宮共和大学)
  6. 乙武 北斗(福岡大学 工学部 電子情報工学科)
  7. 吉田 光男(豊橋技術科学大学 情報・知能工学系)
  8. 荒木 健治(北海道大学大学院情報科学研究科)