DEIM2019学生レポート

DEIM1日目インタラクティブセッションの開会式の様子

3/4 から 3/6 にかけて山本研 B4 の 6人で第11回「データ工学と情報マネジメントに関するシンポジウム(DEIM2019)」 に参加してきました。学生を中心に大学や企業の研究者などが多様なテーマで論文発表を行い、私たちもそれぞれがポスターやスライドを用いた発表をしてきました。学会というもの自体初めての経験でしたが、全国の研究者の方々から自分の研究に関するコメントをいただき、また同学年の人たちがどのような研究を行っているかも知ることもでき、勉強になると共に大いに刺激を受けました。

DEIM2019では研究のテーマ毎に90分を一単位として会場が分けられ、それらセッション毎に4~5回の発表が行われました。以下では各自の参加したセッションについての感想の一部を紹介します。

梅田 浩郎  感情・感性(2)

 このセッションでは5つの研究が発表された。そのうちの1つが私の研究「笑えるウェブ情報検索のためのクエリ推薦」である。提案内容は、クエリ入力時にクエリと組み合わせると笑いを誘発する語を提示することで笑いを発生させることだ。目的は、笑える情報を検索可能にすることではなく、笑いを誘発する語の組み合わせを見ることで笑いを発生させることである。単語間の意外性と対立性に注目し、ウェブページの構造やウェブ検索結果を用いることで笑いを誘発する語を推定した。評価実験では実際にユーザが笑える語を推薦できているかを評価し、結果として意外性と対立性を考慮することで笑いを誘発する語を推薦できる可能性があることが分かった。

 私の研究以外の4つの研究は、ユーザの個性を反映させることで文書の感情応答を改善する研究、ツイートの内容から九州地方の道の駅を評価する研究、旅行者の感性にもとづいて観光順路を提案する研究、未知語に対して感情解析を行う手法の研究といったものだった。感情・感性1のセッションと同様に、人の感情や感性を取り入れることで問題の解決に挑戦する点が共通していた。

 以上のセッション以外にも多くのセッションで様々な研究発表があった。自分が知らない分野や知識が多かったが、刺激受けるとても良い機会だった。研究内容について刺激を受けるだけでなく、研究内容を伝えるためのプレゼン方法やポスターの作り方などにも刺激を受けた。また、他大学の学生と交流をでき、楽しみのある場でもあった。

齊藤 史明 情報の品質(2)

研究データマネジメントルーブリックによる自己評価と共通認識の醸成

 研究データマネジメント(RDM)とは、研究についてデータの作成方法や命名規則、保存方法や公開範囲といった利用環境を明確にしチーム間で実施することである。このRDMの評価を、到達度を観点ごとに評価する表を用いるルーブリックと呼ばれる手法を用いて行う。ワークショップを実施した結果、実際にすべきことと実態の差を埋める可能性があることが示された。

コンテンツの信頼性評価に関する考察

 機械だけでは評価が難しいものに対して、人の知識を合わせて協力することで問題を解決することを目指す。例として食品ロスを無くすために、冷蔵庫の中身を認識し消費期限などを適切に表示するためのシステム構築から、個人の価値観から信頼性を評価する手法の考察を行った。

文書の意見と信憑性がユーザの検索行動および信念の変化に与える影響の分析

 ウェブ情報についてその情報がどのような意見なのかと、信憑性があるかどうかに注目し、行動や意見の変化への効果を分析した。結果として、ウェブ探索を行うユーザにユーザの考えと反する意見の載った情報を見せることで、より情報について調べるようになり、意見が変化する可能性が高まるようになった。

藤堂 晶輝 情報検索(2)

 情報検索という枠のなかでも、研究の視点や取り組み方はさまざまだった.検索方法を工夫する研究もあれば,検索対象となるデータの生成についての研究もあった.

 私が発表した「情報の食わず嫌いを抑制する情報提示方法」についての研究では,情報検索する際の人の行動を変化させるため,情報の表示に着目した.「情報の食わず嫌い」とは,有用かつ読み取れる情報であるにもかかわらず,読むことに抵抗を感じ,意図的に情報入手を避けることと定義した.そして,これの発生を抑制するための情報提示方法を提案した.ユーザ実験の結果の中から,英語に苦手意識があり,英語に対して情報の食わず嫌いを起こしやすいと考えられる被験者のデータを抽出した.すると,該当箇所を黒塗りして隠す手法の導入によって行動の変化が確認できた.情報の提示方法を工夫することは,情報の食わず嫌い抑制に有効に作用する可能性がある.

 他の研究でも,従来の検索システムでは達成できないような問題に取り組まれていた.

 多彩な研究がなされているのを目にし,情報学という分野が非常に幅広い分野に及んでいることを実感させられた.また発表の場では,これまでに考えてきたことを,短時間で正確に伝えることの難しさを感じた.自身の研究について今までに検討していなかった視点を知ることもでき,有意義だった.

中野 裕介 Web(2)

 DEIM2日目のWeb(2)セッションに発表者として参加しました。私の他に発表した4人の内容は、Web広告推薦などに用いられるユーザ嗜好の評価法の研究、検索手法の性能向上に関する実験、観光のための複合的なアプリケーション開発、そしてユーザの好みに合わせた映画トレーラー映像の編集手法の提案と、かなりバリエーションに富んでおり、正直なところどういう基準で区分したのかよくわかりませんでした。

 私はこの中で、卒業研究としても取り組んできた「脚本の内容と構成要素に基づく映画印象推定」と題した研究について発表しました。内容は、映画の印象を推定する一手法であるジャンルに着目し、映画の脚本データを利用してそれを機械的に分類する手法の提案と、その性能評価を行うというものです。発表では脚本データを特徴量に変換するために設定した概念の説明や、この手法を用いた出力結果を具体例として提示を行い、感覚的に理解してもらえるよう努めました。

 上述した通り、本セッションでは私の他にも映画に関する研究が発表されていました。この研究では映画の本編ではなく、トレーラー動画をユーザの好みに合わせた形に編集するという着想をもとに、カット割りやシーン入れ替えなどの差異によるユーザへの影響の分析を行っていました。ここで紹介されていた手法についてはトレーラー動画のみならず映画演出という観点でユーザに与える印象を分析することにも通じるように感じました。

堀内 進次 SNS(2)

行動促進ツイートから根拠部分抽出手法

 行動促進ツイートとは「地震のときは○○しましょう」などといったツイートのことを言う。行動促進ツイートの中には、「××だから地震のときは○○しましょう」といった根拠を含むツイートが存在する。こういった根拠を含む行動促進ツイートは含まないツイートよりも信用されているという予備調査のもと根拠部分の抽出を行った。

Twitter上で配信されるニュースの偏りを考慮した推薦手法

 近年、ニュースは多様な立場から書かれている。SNS上では思想が似たユーザがフォローしあうことでエコーチェンバーやフィルターバブルなどといった現象が起こり、意見が偏ってしまう。こういった現象を防ぐためにコミュニティごとにあるニュースについて関連するニュースでもそのコミュニティとは支持が違うニュースを提示する手法の提案を行った。

マイクロブログにおいて論争課する議論の予測に向けて

 ある論争について同じ意見の人同士のみで交流してしまうという極化を問題としてあげている。しかし、極化を解決することは難しいといわれることからそのような研究は行われていない。この研究では論争が始まることを防ぐために論争化する議論を予測するタスクを提案している。

村西 克仁  食の文化・流通

  このセッションは私が発表者として参加したセッションです。このセッションでは「食」という分野に関して、レビュー・SNS・アンケートなどのデータを活用し、ユーザの行動や傾向について分析するといった研究が発表されました。

 私はセッションの1番目に「飲食店レビュー情報の集合知分析と意思決定支援」という研究について発表しました。内容は、まず飲食店レビューサイトのレビュー評価平均点という情報について集合知としての妥当性を分析し、次に2つのサイトのレビュー評価平均点をユーザに同時に提示することで飲食店の品質評価について慎重な意思決定を促すことができるか検証するというものです。

 私以外の発表者の研究はそれぞれ、GoogleMapsのクチコミを用いてある地域の美味しい食べ物を発見する手法についての研究、Twitterに投稿された食事画像から世界の食事傾向を分析する研究、消費者アンケートのデータから消費者嗜好を把握する研究、飲食店レビュー文書を初訪問者のものと再訪問者のものに自動分類する研究、といったものでした。

まとめ

 多くの研究発表に触れ、情報学のカバーする領域の広さに改めて驚かされました。また同時に、多様なテーマにあっても自分の学んできた知識で理解できる部分も多く見つかり、有用な学習ができているという自信にもつながったように感じます。これを励みに更なる研究に努めたいと思います。

おまけ:前泊の博多で食べたもつ鍋。おいしかったです。

「情報の食わず嫌いを抑制する情報提示方法」

山本研究室学部4年の藤堂です。第11回「データ工学と情報マネジメントに関するシンポジウム(DEIM2019)」にて発表した研究について紹介します。

文章を読んでいる際に、あなたが必要としている情報であるはずなのに、読み飛ばしてしまっているということはありませんか。
私は研究の中で、有用かつ読み取れる情報であるにもかかわらず、読むことに抵抗を感じ、意図的に情報入手を避けることを「情報の食わず嫌い」と定義しました。 これは情報入手の機会を失うことに繋がるため、問題だと考えました。
「情報の食わず嫌い」を抑制するために、英語箇所を対象に、以下の3つの情報提示方法を提案しました。

  • 他のユーザの閲覧態度を提示する手法
  • 英語箇所を拡大表示する手法
  • 英語箇所を黒塗りして隠す手法

ユーザ実験では英語を含むウェブページを閲覧するタスクを与え、被験者の行動測定とアンケート調査を行いました。英語に苦手意識があり、英語に対して情報の食わず嫌いを起こしやすいと考えられる被験者については、特に黒塗り手法の利用によって行動の変化が確認されました。

情報の提示方法を工夫することは、情報の食わず嫌い抑制に有効に作用する可能性があると考えられます。

「珍スポット検索のためのランキング手法の検討」

山本研究室学部4年の堀内です。 第11回「データ工学と情報マネジメントに関するシンポジウム(DEIM2019)」 にて発表した卒業研究について紹介します。

本稿では、珍スポットのランドマーク検索手法の提案を行う。提案手法は、既に珍スポットとわかっているランドマーク名でウェブ検索した結果の文書集合のスニペットおよび、タイトルの形態素解析を行い、文書中に含まれる形容詞の割合が大きいものを珍スポット特有の形容詞とする。その上で、ランドマーク名でウェブ検索した時の文書集合中に珍スポット特有の形容詞が含まれる割合を分析し、その割合が大きいものを珍スポットとなる 可能性が高いと見なす。

本研究では、珍スポットが多いとされる伊豆を取り上げ, 提案シ ステムの評価実験を行った。

ベースラインとなる手法は以下の2手法である。

・“ランドマーク名+ 珍スポット”でウェブ 検索したときの検索結果ヒット数順のリスト

・“ランドマーク名”でウェブ検索したときの 検索結果ヒット数順のリスト

その結果、提案システムがベースラインの手法よりもランキ ングの精度が高いことを明らかにした。

「飲食店レビュー情報の集合知分析と意思決定支援」

山本研究室学部4年の村西です。第11回「データ工学と情報マネジメントに関するシンポジウム(DEIM2019)」にて発表した卒業研究について紹介します。

現在、ウェブ上には様々なレビュー情報サイトが存在する。レビュー情報サイトのレビュー評価平均点という情報はユーザに大きな影響を与える存在であるが、その妥当性について考慮されていないことは問題である。

本研究ではレビュー評価平均点という情報について集合知としての妥当性を分析した。さらに、ユーザに対して2つのサイトのレビュー評価平均点を同時に提示することで、飲食店の品質評価について慎重な意思決定を促すことができるか検討した。

「食べログ」「Retty」というレビュー情報サイトのレビュー評価平均点分析の結果、1つのサイトのみのレビュー評価平均点は正しい集合知として機能していない場合があると分かった。

ユーザ実験の結果、2つのサイトのレビュー評価平均点を同時に提示することは、飲食店の取捨選択行動を効率化するのと同時に比較行動を促す効果があると予想された。

「笑えるウェブ情報検索のためのクエリ推薦」

山本研究室学部4年の梅田が第11回「データ工学と情報マネジメントに関するシンポジウム(DEIM2019)」にて発表した卒業研究について紹介する。

人は笑いを求めており、笑える情報をウェブから検索しようとする。しかし、自身が求めている笑い情報は単純には検索できない。本研究ではクエリ入力時にクエリに関連した笑える語を表示することでウェブ検索プロセスに笑いの機会を与える。

クエリにとっての笑える語を推定するために以下の点に着目した。

  • 意外性:クエリと語の組み合わせが一般的に知られていないこと
  • 対立性:クエリと語の組み合わせが反対の性質を持つこと

意外性と対立性のある語を笑える語として、笑える語ランキングを作成した。また、推定した語が実際に笑える語かどうかをユーザ実験で調査した。そして、実際に笑える語がランキングの上位に出現しているかどうかを評価した。

評価結果から、意外性と対立性を考慮することで笑える語の組み合わせを推薦できる可能性があることが分かった。

「脚本の内容と構成要素に基づく映画印象推定」

本研究室学部4年中野が卒業研究及び第11回「データ工学と情報マネジメントに関するシンポジウム(DEIM2019)」の投稿のために行った研究について紹介する。

ユーザが好みの映画を検索する(印象を推定する)手法としてジャンルはポピュラーな指標であるが、その定義は明確でなく、同様の映画であっても別の映画情報サイトでは異なるジャンルが与えられている場合がある。本研究では映画に一律な基準でジャンルを付与すべく、映画の脚本データを用いて映画にジャンルを付与する分類器を作成した。

分類器の作成にあたり、次の手続きを行った

  • データベースサイトから1007件の脚本データを取得し、328次元の特徴量に変換する
  • 脚本データが一定以上存在する10ジャンルについて、データベースサイトで設定されたジャンルラベルを正解データとする機械学習(SVM)を行い分類器を作成する。

脚本データを特徴量に変換する際には脚本の構造と内容の2つの要素を切りだすべく、脚本理論に基づく独自手法と、文書の分散表現を得る手法であるDoc2vecを利用した。

提案手法と対抗手法と比較実験を行った結果、対象のジャンルの分類性能をF値で評価した時、最多のジャンルで最高値を記録した。

「文章表現の曖昧さ指摘による情報精査の態度・行動促進」

山本研究室学部4年の齊藤です。 第11回「データ工学と情報マネジメントに関するシンポジウム(DEIM2019)」 にて発表した卒業研究について紹介します。


「~と言われている」や「某○○は~」といった、実際に誰の発言なのか明確でない文章表現が使われた情報について、読み手はその信憑性に気をつける必要がある。読み手の情報精査の態度・行動促進を行うために、曖昧な表現のある文章を検出し、ハイライト表示をするシステムの作成を行った。

システム作成のために2つのことを行った。
・曖昧な文の識別システムの作成
・ハイライト表示の効果の測定

識別システムは機械学習にて検出器を作成し、Wikipediaの文章をデータセットとした。性能はF1値で0.7を超えた。

ユーザ実験の結果、ハイライト表示をすることで読み手は短時間で記事を読むようにウェブ探索を行うようになり、よく知らない・自信の無い分野について調べる場合に多くのウェブページを訪問するようになった。

DEIM2019で研究成果を発表

2019年3月4〜6日にかけて長崎県はハウステンボスで開催された第11回「データ工学と情報マネジメントに関するシンポジウム(DEIM2019)」にて,今年度の研究室の成果を発表しました.

発表内容は以下の通りです:

  • 梅田浩郎, 山本祐輔:笑えるウェブ情報検索のためのクエリ推薦第11回データ工学と情報マネジメントに関するフォーラム(DEIM2019), pp.C7-2, March 2019.
  • 齊藤史明, 山本祐輔:文章表現の曖昧さ指摘によるウェブ情報精査の態度・行動促進第11回データ工学と情報マネジメントに関するフォーラム(DEIM2019), pp.C2-2, March 2019 (学生プレゼンテーション賞).
  • 藤堂晶輝, 山本祐輔:情報の食わず嫌いを抑制する情報提示方法第11回データ工学と情報マネジメントに関するフォーラム(DEIM2019), pp.G6-3, March 2019.
  • 中野裕介, 山本祐輔:脚本の内容と構成要素に基づく映画印象推定第11回データ工学と情報マネジメントに関するフォーラム(DEIM2019), pp.I3-3, March 2019 (学生プレゼンテーション賞).
  • 堀内進次, 山本祐輔:珍スポット検索のためのランキング手法の検討第11回データ工学と情報マネジメントに関するフォーラム(DEIM2019), pp.P1-141, March 2019.
  • 村西克仁, 山本祐輔:飲食店レビュー情報の集合知分析と意思決定支援第11回データ工学と情報マネジメントに関するフォーラム(DEIM2019), pp.F3-1, March 2019.


ACM WebSci 2018で発表を行いました

2018年5月28-30日オランダはアムステルダムにて開催されたACM WebSci 2018にて、”Web Access Literacy Scale to Evaluate How Critically Users Can Browse and Search for Web Information”というタイトルの発表を行いました。

本公演に関する論文の書誌情報は以下のとおりです:

Yusuke Yamamoto, Takehiro Yamamoto, Hiroaki Ohshima, and Kawakami Hiroshi: Web Access Literacy Scale to Evaluate How Critically Users Can Browse and Search for Web Information, Proceedings of the 10th ACM Conference on Web Science (WebSci 2018), pp.97-106, Nederland, Amsterdam, May 2018.

また、本公演で用いた発表資料は以下でご確認いただけます。

DEIM2018口頭発表の資料をアップロード

2018年3月4-6日に福井県は芦原温泉で行われた第10回データ工学と情報マネジメントに関するフォーラム(DEIM2018)で、JST RISTEX「人と情報のエコシステム」プログラムに支援いただいている研究発表を行いました。発表題目は「批判的ウェブ情報探索リテラシー尺度の開発」です。

発表スライドをアップロードしましたので、ご興味・ご関心のある方はご覧ください。