乙武北斗

研究・特徴語の抽出

 

地方議員が4年間の任期の間に議会で何について発言したかご存知ですか?

 

小樽商科大学商学部  木村 泰知
宇都宮共和大学シティライフ学部  高丸 圭一

最終更新日:

TF・IDF法による議会発言特徴語とは? | 全国の地方議会の議員別議会発言特徴語

 

 平成27年4月の統一地方選挙までの4年間(平成23年4月~平成27年3月)の地方議会議員の活動の実体を可視化する試みの一つとして,地方議会議員の議会発言特徴語*リストを作成しました。
 国会議員とは異なり,日常的な議会活動が報道に載ることが少なく,市民はその実体を知る機会が少ないという問題があります。また,議会の記録である会議録は多くの自治体でインターネットで公開されているものの,分量が膨大ですべてを読むことはできません。議会発言特徴語はそれぞれの議員がどの分野のことについて多く発言しているのかを端的に知る手がかりとなります。

 


 

 

(*)議員発言特徴語とは,簡単にいうとある議員が他の議員よりも多く発言した単語のことです。その議員が何に注力していたかを表しているということができます。TF・IDF法という技術により,議会会議録に記録された発言の名詞(複合名詞)のうち,(1)その議員は多く使用していて,(2)その単語を使用した議員が少ない場合にスコアが高くなるような計算式によって選ばれています。

 


ページの先頭へ | 全国の地方議会の議員別議会発言特徴語

 

TFIDF_for_giin_0326


ページの先頭へ | TF・IDF法による議会発言特徴語とは?

全国の地方議会の議員別議会発言特徴語 (順次公開中)

都道府県&都道府県庁所在地(市)

  • 北海道
  • 青森県
  • 岩手県
  • 宮城県
  • 秋田県
  • 山形県
  • 福島県
  • 茨城県
  • 栃木県
  • 群馬県
  • 埼玉県
  • 千葉県
  • 東京都
  • 神奈川県
  • 新潟県
  • 富山県
  • 石川県
  • 福井県
  • 山梨県
  • 長野県
  • 岐阜県
  • 静岡県
  • 愛知県
  • 三重県
  • 滋賀県
  • 京都府
  • 大阪府
  • 兵庫県
  • 奈良県
  • 和歌山県
  • 鳥取県
  • 島根県
  • 岡山県
  • 広島県
  • 山口県
  • 徳島県
  • 香川県
  • 愛媛県
  • 高知県
  • 福岡県
  • 佐賀県
  • 長崎県
  • 熊本県
  • 大分県
  • 宮崎県
  • 鹿児島県
  • 沖縄県
  • 札幌市
  • 青森市
  • 盛岡市
  • 仙台市
  • 秋田市
  • 山形市
  • 福島市
  • 水戸市
  • 宇都宮市
  • 前橋市
  • さいたま市
  • 千葉市
  • (東京23区)
  • 横浜市
  • 新潟市
  • 富山市
  • 金沢市
  • 福井市
  • 甲府市
  • 長野市
  • 岐阜市
  • 静岡市
  • 名古屋市
  • 津市
  • 大津市
  • 京都市
  • 大阪市
  • 神戸市
  • 奈良市
  • 和歌山市
  • 鳥取市
  • 松江市
  • 岡山市
  • 広島市
  • 山口市
  • 徳島市
  • 高松市
  • 松山市
  • 高知市
  • 福岡市
  • 佐賀市
  • 長崎市
  • 熊本市
  • 大分市
  • 宮崎市
  • 鹿児島市
  • 那覇市

県庁所在地以外の政令指定都市

  • 神奈川県川崎市
  • 神奈川県相模原市
  • 静岡県浜松市
  • 大阪県堺市
  • 福岡県北九州市

東京23区

  • 東京都足立区
  • 東京都荒川区
  • 東京都板橋区
  • 東京都江戸川区
  • 東京都大田区
  • 東京都葛飾区
  • 東京都北区
  • 東京都江東区
  • 東京都品川区
  • 東京都渋谷区
  • 東京都新宿区
  • 東京都杉並区
  • 東京都墨田区
  • 東京都世田谷区
  • 東京都台東区
  • 東京都千代田区
  • 東京都中央区
  • 東京都豊島区
  • 東京都中野区
  • 東京都練馬区
  • 東京都文京区
  • 東京都港区
  • 東京都目黒区

研究・オノマトペ

概要

オノマトペの使用実態の分析

 地方議会会議録コーパスに含まれるオノマトペ(擬音語・擬態語)について分析を進めています。 公的な場である地方議会でもオノマトペが頻繁に使用されています。特に,施策の推進や明確な言及や適切な判断を求めるために使われる表現(例えば「しっかり」「はっきり」「どんどん」など)が多く出現します。
 全体的な傾向としては,西日本の地方議会でオノマトペがやや多く使われています。以下のグラフは地方議会会議録中のオノマトペの出現確率を地方別に集計した結果です。近畿地方でオノマトペがもっとも多く出現し、次いで、中国・四国地方、九州・沖縄地方の順となっています。

オノマトペの出現確率(6地方分類)
ono_bunpu

 オノマトペの中には使用される地域に偏りが見られるものがあります。特定の地域で多く使われるオノマトペを幾つか紹介します。

  • 九州地方では「ぴしゃっ」に他の地域とは異なる語義があり、多用されます。

    「ぴしゃっ」(共通語の語義:ある基準で完全にやめる,閉める,止めるさま)

    • ・・・市長はお金がないというたった一言でぴしゃっと切ってしまったんです。(和歌山県和歌山市)
    • 逆にきょう呼んでしっかり話をして、それでぴしゃっとやめるとなれば、やれないことないと思うけど、呼んでちゃんと話をして・・・(長野県松本市)
    • ・・・あの地域内に水が入るのをぴしゃっと入り口でとめていただいたということで、大変対応がよかったというふうなことを、まず、感謝を申し上げたいと思います。(山口県山陽小野田市)
    「ぴしゃっ」(九州方言の語義)

    • だから、審査会の権限とか、そういうものについてぴしゃっと明らかにして示す必要があるんじゃないかというふうに思うんですが、そこら辺についてどう考えますか。(福岡県嘉麻市)
    • そりゃ、職員は黒字が出ようが赤字が出ようがぴしゃっとボーナスも出ておる。(長崎県雲仙市)
    • それから、そのときも出たんですけれども、資料の提出方法を、もうちょっとぴしゃっと定めた方がいいのかなというような気はいたしました。(熊本県熊本市)
    • ここら辺をぴしゃっと整備しなければいけないというふうに思っておりますし、住民から信頼される自治体となるべく努力をしていかなければいけない・・・(宮崎県小林市)
  • 近畿地方を中心に,漠然とした大まかなさまを表す「ばくっ」が多く使われます。

    • ・・・まずは、何ていうんですかね、議会としてのばくっとした考え方なりを聞きたいというそういった思いで委員会、特別委員会だと思っております。(愛知県尾張旭市)
    • ・・・どういう課題が出てくるのかということについてはばくっとは聞きましたけれども、たらればという話がいっぱいあってなかなか定かになっていない・・・(滋賀県大津市)
    • 平均値がどれぐらいちゅのがもしわかれば、ばくっとでも結構です。(大阪府羽曳野市)
    • こうなってくると、ばくっと私が考えるのは、逆にその責任体制が分散してしまって、だれがじゃあこのプロジェクトを回していくのか・・・(兵庫県豊岡市)
  • 山口県において「きらら」が固有表現(名称)に多用されています。

    • ・・・従来より山口大学医学部附属病院などとも連携を図りながら、消防防災ヘリ「きらら」を活用し、ドクターヘリ的な運用による救急救命活動を展開しております。(山口県宇部市)
    • ・・・補助するグループホームはゆもと苑に併設されているきららの里で、この施設以外は全部火災通報設備は設置されているとの説明がありました。(山口県長門市)
    • 県はきらら博に始まり、国民文化祭、そして国民体育大会と大型イベントを行う一方で、福祉政策の費用をカットする態度は、決して許されるものではない。(山口県周南市)
    • 山陽小野田市きららガラス未来館の指定管理者の指定について質疑を行います。(山口県山陽小野田市)

オノマトペを工学的に利活用するための技術

 日本語に含まれるオノマトペの工学的な利活用を目指して,自動抽出手法語義分類手法などの研究にも取り組んでいます。
 オノマトペは,短いひらがなやカタカナの文字列であるため,文の中からオノマトペを正確に抜き出すことは難しいとされています。例えば,咳払いの音を表すオノマトペ「えへん」を地方議会会議録から抜き出そうとすると,関西方言の「~~せえへん」を大量に抜き出してしまいます。このため,オノマトペとして使われるものだけを適切に抽出する技術が必要となります。

  • ほんで、残業せえへんかったらもう行くところないわと。(京都府宇治市)
  • やっぱり農協だけではね、そら金のやっぱり入ってけえへんところは、なかなか手出しにくいんですわ。(大阪府河内長野市)

 また,オノマトペには複数の語義を持つものが多くあります。例えば「とんとん」は会議録に以下のように出現します。これらがどの意味で使われているかを推定(分類)する技術が必要となります。

  • 「とんとん」二つのものが同じくらいであるさま
    皆さんが立てられた経営改革プランは、あと2年したら収支とんとんぐらいになるということで病院の経営改革をされたでしょう。(兵庫県川西市)
  • 「とんとん」順調にはかどるさま
    すばらしい条例なので、とんとんと進むのかなと思ったら、結構時間もかかりましたし、きょうもいろいろ意見が出ているということで、いろいろな議論があるということを認識しました。(宮城県)
  • 「とんとん」軽くたたく音
    保育所では胸をとんとんして寝かしつけるということで、それで何とか落ちついてるという状況でございます。(福岡県北九州市)

 地方議会会議録に含まれるオノマトペの実例データを公開する準備を進めています。ご関心をお持ちの方はお問い合わせください。

研究業績

発表資料(PDFファイルにリンクしています)

ポスター(PDFファイルにリンクしています)

オノマトペ研究班

10339294_10204042580051711_5616193156009390935_o (1)

会議録の横断検索

プロジェクトリーダ 木村泰知
言語分析担当 高丸圭一
実装担当 乙武北斗

1. 地方議会会議録検索システム

  • 科研費基盤(B)で収集した地方議会会議録コーパスを横断検索できようにしたシステムです。
  • 現在進めている科研費基盤(C)でもデータの追加収集を行っています。
  • この検索システムには,全文検索機能,マップ検索機能(頻度のマップ表示),クロス表検索機能(年度×自治体などの頻度分布)があります。(一部未実装)
  • 関係者・研究者に限定したβリリースを行っています。関心のある方はご連絡ください。

2. ログイン

  • 「メールアドレス」と発行された「パスワード」の組を入力してログインしてください。
  • パスワードは大切に管理してください。
  • 登録されているメールアドレス宛に種々の連絡をしますので,変更された際はご連絡ください。

fig1

 

 

3. 統計情報

 

 

  • 収録されている会議録のデータ量を自治体別,年度別に表示できます。
  • 平成27年4月現在,2011年度までの市町村議会を中心に収録されています。
  • 平成27年度中に政令指定都市等について最新データの追加収集を進めています。

fig2

 

 

4. 発言検索→シンプル検索

 

 

  • 全文検索を行うことができます。
  • 通常は「フレーズ完全一致」モードを選択してください。
    (※「N-gram分割」モードでは部分一致も表示されます)
  • 複数の語句を検索する場合「AND検索」「OR検索」を切り替えることができます。
  • まず上位50件の結果が表示されます。
  • 「さらに結果を取得する」ボタンでさらに50件ずつ結果が表示されます。

fig3

今後実装される予定の機能

  • 検索結果を一括ダウンロードする機能
  • 年度,地域を限定(選択)した検索機能
  • 検索で見つかった文の前後の文を見る機能
       など・・・・

5. マップ検索→シンプル検索

  • 全文検索の結果を都道府県単位で集計し,頻度や割合(出現確率)を地図に表示することができます。
  • 「頻度を出力」モード:出現頻度を元に地図を塗ります。(※都道府県ごとに収録データ量に偏りがあるため注意が必要)
  • 「割合を出力」モード:出現頻度を登録発言数(≒文数)で割った値(出現確率)を元に地図を塗ります。
  • 「N-gram分割」「フレーズ完全一致」および「AND」「OR」は発言検索と同じです。

fig4

今後実装される予定の機能

  • 地図から発言検索へのリンク
       など・・・・

会議録の収集・整理

概要

 Web公開されている全国の市町村議会会議録を自動収集するプログラムを作成しました。データ形式をそろえた上でデータベースに格納し,コーパスの構築を順次行っています。

研究業績

  • 乙武北斗, 高丸圭一, 渋木英潔, 木村泰知, 荒木健治「地方議会会議録の自動収集に向けた公開パタンの分析」言語処理学会第15回年次大会発表論文集, pp.192-195 (2009)
  • 齋藤誠, 大城卓, 菅原晃平, 永井隆広, 渋木英潔, 木村泰知, 森辰則「地方議会会議録の収集とコーパスの構築」言語処理学会第17回年次大会論文集, P2-21 (2011)
  • 菅原晃平, 大城卓, 齋藤誠, 永井隆広, 渋木英潔, 木村泰知, 森辰則「地方議会会議録コーパスの拡充における問題点の分析と対処」言語処理学会第18回年次大会論文集, P1-15 (2012)
 

関連サイト

プロジェクトメンバー(研究代表者・分担者・連携研究者等)のウェブページ

 

関連サイト

 

 

採択研究課題 (科研費など)

コアプロジェクト

課題:「議論の背景・過程・結果を関連づける地方政治コーパスの構築とその学際的応用」
種目:文部科学省: 科学研究費補助金・基盤研究(B)
期間:2016年4月 – 2020年3月    代表者: 木村泰知
概要:本研究では、地方政治に関する研究の活性化・学際的応用を目指して、「議論の背景」「議論の過程」「議論の結果」を関連づけるコーパスを構築する。具体的に は、新聞記事(議論の背景)、地方議会会議録(議論の過程)、条例(議論の結果)の3つの言語資源を地域、時間、課題の観点から関連づけることを目指す。

    1.    木村泰知 (小樽商科大学)
    2.    高丸圭一 (宇都宮共和大学)     
    3.    小林暁雄 (豊橋技術科学大学)
    4.    坂地泰紀 (成蹊大学)     
    5.    内田ゆず (北海学園大学)     
    6.    乙武北斗 (福岡大学)
    7.    河村和徳 (東北大学)
    8.    川浦昭彦 (同志社大学)
    9.    吉田光男 (豊橋技術科学大学)

 

 

「地方議会会議録コーパスの構築とその学際的応用研究」

  • 科研費基盤(B) http://kaken.nii.ac.jp/ja/p/22300086
  • 平成22~25年度
  • 研究代表者

    • 木村泰知(小樽商科大学)
  • 研究分担者

    • 森辰則(横浜国立大学)
    • 河村和徳(東北大学)
    • 高丸圭一(宇都宮共和大学)
    • 乙武北斗(福岡大学)
    • 湯淺墾道(情報セキュリティ大学院大学情報セキュリティ研究科)
    • 小林哲郎(国立情報学研究所)平成22年4月から平成24年1月まで
  • 研究協力者

    • 渋木英潔

関連プロジェクト

「学際的応用を考慮した地方議会議録コーパスの言語学的研究」

  • 科研費基盤(C) http://kaken.nii.ac.jp/d/p/26370498.ja.html
  • 平成26~28年度
  • 研究代表者

    • 高丸圭一(宇都宮共和大学)
  • 研究分担者

    • 木村泰知(小樽商科大学)
    • 乙武北斗(福岡大学)
    • 井上史雄(国立国語研究所)

「公共用語の地域差に関する社会言語学的総合研究」

  • 科研費萌芽研究 http://kaken.nii.ac.jp/d/p/23652102
  • 平成23~24年度
  • 研究代表者

    • 井上史雄(明海大学)
  • 研究分担者

    • 岸江 信介(徳島大学) 木村 泰知(小樽商科大学) 高丸 圭一(宇都宮共和大学) 田中 宣広(岩手県立大学宮古短期大学部) 半沢 康(福島大学) 山下 暁美(明海大学) Daniel Long(首都大学東京)

 

  • 科研費基盤(C) http://kaken.nii.ac.jp/d/p/25370524.ja.html
  • 平成25~28年度
  • 研究代表者

    • 井上史雄(国立国語研究所)
  • 研究分担者

    • 木村泰知(小樽商科大学)
    • 高丸圭一(宇都宮共和大学)
    •  
    •  

 

「地方議会議員と住民の協働支援のためのデータ放送の利活用に関する基礎研究」

  • 放送文化基金研究助成
  • 平成24年度
  • 研究代表者

    • 木村泰知(小樽商科大学)
  • 研究分担者

    • 森辰則(横浜国立大学)
    • 高丸圭一(宇都宮共和大学)
    • 乙武北斗(福岡大学)

「北海道における地方議員と住民間の協働支援システムの研究開発」

  • 総務省戦略的情報通信研究開発推進制度(SCOPE)地域ICT
  • 平成20~21年度
  • 研究代表者

    • 木村泰知(小樽商科大学)
  • 研究分担者

    • 森辰則(横浜国立大学)
    • 渋木英潔(合同会社ディクティオ/横浜国立大学)
    • 高丸圭一(合同会社ディクティオ/宇都宮共和大学)
    • 米谷信昭((株)テクノラボ)
    • 山崎記敬(株式会社 HARP)

研究概要

第2期木村科研

 

本研究では、地方政治に関する研究の活性化・学際的応用を目指して、「議論の背景」「議論の過程」「議論の結果」を関連づけるコーパスを構築する。具体的に は、新聞記事(議論の背景)、地方議会会議録(議論の過程)、条例(議論の結果)の3つの言語資源を地域、時間、課題の観点から関連づけることを目指す。

 

第1期木村科研

本研究では、地方政治に関する研究の活性化・学際的応用を目指して、研究者が利用可能な地方政治電子化コーパスを全国規模で構築しウェブ上で提供することを目指しています。また、そのコーパスを利用して政治学、言語学、情報工学の研究を行い、その成果を学際的に応用した政治情報システムの開発を行う予定です。
本研究には以下の3つの大きな目的があります。

  1. 地方政治の研究者に向けた電子化コーパスを構築しポータルサイト等を通して提供する。
  2. 上記のコーパスを用いて政治学、言語学、情報工学の各分野の研究を行う。
  3. 上記の研究成果を学際的に応用した政治情報システムの研究開発を行う。