AI(人工知能)で新宿区議会の議案を審査!ナイーブベイズ分類器で実験してみた

こんばんは。新宿区議会議員の伊藤陽平です。

(自称)AI議員として簡単な実験を行ったので、ご報告させていただきます。
議員の主な仕事として、質問と議案の審査の二つがあります。
ちょうど来週の月曜日に区議会で議案の審査が行われる予定なので、AIで対応できないか試してみました。

議案はこちら。

平成29年第4回区議会定例会提出案件概要 [PDF形式:271KB] (新規ウィンドウ表示)

平成29年第4回区議会定例会提出案件概要(追加分) [PDF形式:102KB] (新規ウィンドウ表示)

今回ご紹介させていただくのは、機械学習による分類問題です。
Gmailなどを利用されている方はご存知かと思いますが、スパムメールが自動的に振り分けられているのは、機械学習を用いてメールの内容がスパムかどうかを分類されているからです。
以前もディープラーニングを活用し、区民意見の分析に関する実験をご紹介させていただきました。
AI議員奮闘記。人工知能で区民の意見を分析してみた

文章をコンピュータで読み込み内容がネガティブかポジティブかを判断することにも活用されています。
また、ビジネスの世界では、キュレーションメディアで自動的にカテゴリーを分ける際にも活用されるなど大活躍です。

仕組みについてご説明させていただくと、文章を形態素解析という手法で単語に分解します。

数学の専門家ではないため細かい説明はプロにお任せするとして、ざっくり説明すると、単語の出現頻度により確率的な分類を実現します。

今回はナイーブベイズ分類器という手法を用いることで、議案の審査をAI(人工知能)で代替してみます。
こちらの書籍を参考に、プログラムを作ってみました。

Amazon | Pythonによるスクレイピング&機械学習 開発テクニック BeautifulSoup, scikit-learn, TensorFlowを使ってみよう | クジラ飛行机 | ソフトウェア開発・言語

とりあえず、スパムメールを分類するように、過去の議案の態度から自動的に賛否を分類するということができるはず、と考えました。
今回は、人工知能版の伊藤陽平を開発するという前提です。
過去の議案と賛否を、Excel(CSV)にまとめて突っ込んでみます。
そして、実際にプログラムを動かしてみました。

例えば、区議会議員の報酬を増額するという議案があります。

公務員給与や議員報酬の増額については、わたしはこれまで一貫して反対してきましたが、今回も態度は変わりません。
コンピュータに議案を読み込ませてみました。

過去の実績から、反対という結果になりました。

次は、文教子ども家庭委員会で審査を行なったこちらの議案。

キッズウィークの登場により、条例の引用条項が変わったというものです。
事務的な手続きなので特に反対する理由もありませんが、こちらも過去の傾向から正しい回答が得られました。

最後は、住宅宿泊事業(民泊)に関する条例です。

こちらの議案には反対をする予定ですが、過去に似た事例がない完全に新たな議案です。
コンピュータの出した結果は以下の通りです。

なんと、外してしまいました!
議案の態度のみしか学習データがなかったことが原因です。
本定例会の代表質問では、民泊について触れてきました。
学習データとして投入すると、反対という結果が出ました。

他議会の議案を読み込ませたところ、多少文言が変わっても正解することができました。

議案の審査を行うと高精度で正しい結果が得られることがわかりましたが、まだ使えるものではありません。
まず、確率的なアプローチで賛否を判断しても、議論の過程まで出すことができないという点は、大きな課題です。
議会ではパフォーマンスで反対をするだけではなく、対話を通じて一部でも改善につなげられないか交渉をすることも大切です。
また、予算案などの場合、この部分は賛成でこの部分は反対、というように、さらに細かい判定が必要です。

また、学習データに何を用いるかについても検討が必要です。
今回のように過去の議案態度のみでは、政治姿勢が変わった場合に対応することができません。
先ほどの民泊の事例のように、過去の質問、ブログ、あるいは日常会話等までテキスト化して学習データを用意することで、より精度を高めることは可能ですが、労力がかかります。

予算や決算、新たな規制に関する条例制定、あるいは法律改正による条例の文言修正など、議案は様々です。
そのため、分類機により議案の種類を大まかに分類するだけでも効果的です。
議案を判断する際のポイントが異なるため、タイプごとにプログラムを用意することで、さらに高精度な判定ができるシステムを構築する必要があるでしょう。
細かな分類が可能な場合、前述の修正案等を自動生成することまで対応できれば、コンピュータが政策秘書のような役割を担うこともできるようになるかもしれません。

今回の実験はかなり強引で、実験というよりも遊びに近い取り組みでしたが、プログラムを書いたことで、人工知能で何ができるか理解を深めることができました。
議会や行政にも何かを分類する仕事はたくさんあります。今後はAIで効率化されていくことになるでしょう。

私は技術者ではありませんので、機械学習を専門とされている方からすれば問題だらけのブログだと思います。
色々な研究や民間のノウハウも吸収しながら、前に進めていきたいと考えています。
技術力や資金等でご協力いただける方がいらっしゃいましたら、ぜひお気軽にお声がけいただければと思います。

それでは本日はこの辺で。

ABOUTこの記事をかいた人

伊藤 陽平

新宿区議会議員(無所属) / 1987年生まれ / 早稲田大学招聘研究員 / グリーンバード新宿チームリーダー / Code for Shinjuku代表 / JPYC株式会社