物語文の具象性をフィードバックする文書作成インターフェース

山本研究室学部4年の伊藤です.今回は私の卒業研究について紹介します.

私は卒業研究として,文章の具象性を推定する機械学習モデルを構築し,そのモデルと連動する文書作成インターフェースを試作しました.

本研究において,具象性は「物語における対象の想像しやすさ」と定義しています.例えば,「木が揺れている」という文章があったとします.この文章からは,木がどのように揺れているかわからないため,想像がしづらいですよね.では,次のように文章を書き変えてみます.「風にあおられて,木がゆさゆさと揺れている」.これならどうでしょうか.先ほどの文章と比べて,木が揺れている感じが想像しやすくなったと思います.これはつまり,後者の方が具象性が高いということです.

小説を書いている時に,自分の描写の具象性がどの程度であるか確認するには,他人に聞いてみるしかありません.しかし,他人からの評価は定性的なものなので,尺度がはっきりせず,あまり当てにならない場合も多いと思います.そこで,本研究では,文章の具象性を定量的にフィードバックする文書作成インターフェースを試作しました.このインターフェースを利用することで,ユーザーがより具象性の高い描写を生成する支援が行えるのではないかと思います.

具象性の推定には,機械学習を利用しました.具体的には,青空文庫から収集した文章データを,独自に選択した特徴量でベクトル化し,機械学習を行って具象性推定モデルを構築しました.

構築したモデルを評価するために,以下の3つの特徴量で構築したモデルの精度を比較しました.tf-idfとは,文章中の単語の重要度を表すものです.

  • 提案特徴量
  • tf-idf
  • 提案特徴量 + tf-idf

結果,提案特徴量はtf-idfに精度で劣るものの,両者を組み合わせることで,tf-idfのみの精度を上回ることが明らかになりました.

また,インターフェースの試作も行いましたが,評価実験を行うことができていないため,執筆の支援に有効であるかは確認できていません.評価実験を行うことが今後の課題です.