情報の食わず嫌いを抑制する情報提示方法

山本研究室学部4年の藤堂です。第11回「データ工学と情報マネジメントに関するシンポジウム(DEIM2019)」にて発表した研究について紹介します。

文章を読んでいる際に、あなたが必要としている情報であるはずなのに、読み飛ばしてしまっているということはありませんか。
私は研究の中で、有用かつ読み取れる情報であるにもかかわらず、読むことに抵抗を感じ、意図的に情報入手を避けることを「情報の食わず嫌い」と定義しました。 これは情報入手の機会を失うことに繋がるため、問題だと考えました。
「情報の食わず嫌い」を抑制するために、英語箇所を対象に、以下の3つの情報提示方法を提案しました。

  • 他のユーザの閲覧態度を提示する手法
  • 英語箇所を拡大表示する手法
  • 英語箇所を黒塗りして隠す手法

ユーザ実験では英語を含むウェブページを閲覧するタスクを与え、被験者の行動測定とアンケート調査を行いました。英語に苦手意識があり、英語に対して情報の食わず嫌いを起こしやすいと考えられる被験者については、特に黒塗り手法の利用によって行動の変化が確認されました。

情報の提示方法を工夫することは、情報の食わず嫌い抑制に有効に作用する可能性があると考えられます。

珍スポット検索のためのランキング手法の検討

山本研究室学部4年の堀内です。 第11回「データ工学と情報マネジメントに関するシンポジウム(DEIM2019)」 にて発表した卒業研究について紹介します。

本稿では、珍スポットのランドマーク検索手法の提案を行う。提案手法は、既に珍スポットとわかっているランドマーク名でウェブ検索した結果の文書集合のスニペットおよび、タイトルの形態素解析を行い、文書中に含まれる形容詞の割合が大きいものを珍スポット特有の形容詞とする。その上で、ランドマーク名でウェブ検索した時の文書集合中に珍スポット特有の形容詞が含まれる割合を分析し、その割合が大きいものを珍スポットとなる 可能性が高いと見なす。

本研究では、珍スポットが多いとされる伊豆を取り上げ, 提案シ ステムの評価実験を行った。

ベースラインとなる手法は以下の2手法である。

・“ランドマーク名+ 珍スポット”でウェブ 検索したときの検索結果ヒット数順のリスト

・“ランドマーク名”でウェブ検索したときの 検索結果ヒット数順のリスト

その結果、提案システムがベースラインの手法よりもランキ ングの精度が高いことを明らかにした。

飲食店レビュー情報の集合知分析と意思決定支援

山本研究室学部4年の村西です。第11回「データ工学と情報マネジメントに関するシンポジウム(DEIM2019)」にて発表した卒業研究について紹介します。

現在、ウェブ上には様々なレビュー情報サイトが存在する。レビュー情報サイトのレビュー評価平均点という情報はユーザに大きな影響を与える存在であるが、その妥当性について考慮されていないことは問題である。

本研究ではレビュー評価平均点という情報について集合知としての妥当性を分析した。さらに、ユーザに対して2つのサイトのレビュー評価平均点を同時に提示することで、飲食店の品質評価について慎重な意思決定を促すことができるか検討した。

「食べログ」「Retty」というレビュー情報サイトのレビュー評価平均点分析の結果、1つのサイトのみのレビュー評価平均点は正しい集合知として機能していない場合があると分かった。

ユーザ実験の結果、2つのサイトのレビュー評価平均点を同時に提示することは、飲食店の取捨選択行動を効率化するのと同時に比較行動を促す効果があると予想された。

笑えるウェブ情報検索のためのクエリ推薦

山本研究室学部4年の梅田が第11回「データ工学と情報マネジメントに関するシンポジウム(DEIM2019)」にて発表した卒業研究について紹介する。

人は笑いを求めており、笑える情報をウェブから検索しようとする。しかし、自身が求めている笑い情報は単純には検索できない。本研究ではクエリ入力時にクエリに関連した笑える語を表示することでウェブ検索プロセスに笑いの機会を与える。

クエリにとっての笑える語を推定するために以下の点に着目した。

  • 意外性:クエリと語の組み合わせが一般的に知られていないこと
  • 対立性:クエリと語の組み合わせが反対の性質を持つこと

意外性と対立性のある語を笑える語として、笑える語ランキングを作成した。また、推定した語が実際に笑える語かどうかをユーザ実験で調査した。そして、実際に笑える語がランキングの上位に出現しているかどうかを評価した。

評価結果から、意外性と対立性を考慮することで笑える語の組み合わせを推薦できる可能性があることが分かった。

脚本の内容と構成要素に基づく映画印象推定

本研究室学部4年中野が卒業研究及び第11回「データ工学と情報マネジメントに関するシンポジウム(DEIM2019)」の投稿のために行った研究について紹介する。

ユーザが好みの映画を検索する(印象を推定する)手法としてジャンルはポピュラーな指標であるが、その定義は明確でなく、同様の映画であっても別の映画情報サイトでは異なるジャンルが与えられている場合がある。本研究では映画に一律な基準でジャンルを付与すべく、映画の脚本データを用いて映画にジャンルを付与する分類器を作成した。

分類器の作成にあたり、次の手続きを行った

  • データベースサイトから1007件の脚本データを取得し、328次元の特徴量に変換する
  • 脚本データが一定以上存在する10ジャンルについて、データベースサイトで設定されたジャンルラベルを正解データとする機械学習(SVM)を行い分類器を作成する。

脚本データを特徴量に変換する際には脚本の構造と内容の2つの要素を切りだすべく、脚本理論に基づく独自手法と、文書の分散表現を得る手法であるDoc2vecを利用した。

提案手法と対抗手法と比較実験を行った結果、対象のジャンルの分類性能をF値で評価した時、最多のジャンルで最高値を記録した。

文章表現の曖昧さ指摘による情報精査の態度・行動促進

山本研究室学部4年の齊藤です。 第11回「データ工学と情報マネジメントに関するシンポジウム(DEIM2019)」 にて発表した卒業研究について紹介します。


「~と言われている」や「某○○は~」といった、実際に誰の発言なのか明確でない文章表現が使われた情報について、読み手はその信憑性に気をつける必要がある。読み手の情報精査の態度・行動促進を行うために、曖昧な表現のある文章を検出し、ハイライト表示をするシステムの作成を行った。

システム作成のために2つのことを行った。
・曖昧な文の識別システムの作成
・ハイライト表示の効果の測定

識別システムは機械学習にて検出器を作成し、Wikipediaの文章をデータセットとした。性能はF1値で0.7を超えた。

ユーザ実験の結果、ハイライト表示をすることで読み手は短時間で記事を読むようにウェブ探索を行うようになり、よく知らない・自信の無い分野について調べる場合に多くのウェブページを訪問するようになった。

DEIM2018口頭発表の資料をアップロード

2018年3月4-6日に福井県は芦原温泉で行われた第10回データ工学と情報マネジメントに関するフォーラム(DEIM2018)で、JST RISTEX「人と情報のエコシステム」プログラムに支援いただいている研究発表を行いました。発表題目は「批判的ウェブ情報探索リテラシー尺度の開発」です。

発表スライドをアップロードしましたので、ご興味・ご関心のある方はご覧ください。