DEIM2020参加レポート(鈴木)

学部4年の鈴木です.今回は2020年3月2日から4日にかけて行われたDEIM2020の参加報告について書きます.

本来は福島県で行われる予定でしたが,コロナウィルスの影響によりオンライン上で開催されました.前例のない試みであったにも関わらず無事終えることができ,運営に携わってくださった方々には感謝しております.

私は2日目の情報検索セッションにて,「確証バイアスとウェブ検索行動の関係分析」という研究を発表しました.この研究はウェブ検索において,自分の意見を支持する意見を優先的に閲覧する「確証バイアス」を有するユーザが,どういった検索行動をしているかウェブ検索ログを調べることで明らかにしようとするものです.

ユーザ実験では,確証バイアスを有するユーザとそうではないユーザに分けるため,印象を操作する事前情報をクラウドソーシング上の被験者に与え,ウェブ検索タスクを行いました.

結果,確証バイアスを有するユーザは上位の検索結果を閲覧する傾向にあり,批判的な情報閲覧能力をウェブ検索において活用できない傾向にあることが明らかになりました.

以下,情報検索セッションにて発表された研究の紹介をします.

消費者の語彙と販売者の語彙の類似性を考慮した商品検索

ECサイトにおいて,消費者の使う語彙と販売者の使う語彙をマッチングさせるための研究です.研究の背景には,消費者と販売員の用いる語彙が異なるため,意思疎通が難しいという問題が存在します.
靴を例に取ると,消費者は「初めてのランニングシューズ」といった語彙を使うが,販売員は「エントリーモデル」といった語彙を用いるため,齟齬が生じてしまいます.この語彙をマッチングさせる際の特徴生成には,ECサイトの商品説明やQ&Aサイト上に投稿された質問と回答データを用いていました.
それらを掛け合わせてさらに高次元の特徴ベクトルを作成し,SVMにかけることによって正誤判定を行いました.結果,コサイン類似度を用いたベースラインとMRRを用いた評価手法ではMRRの方が精度は良かったです.

n-TF*IDFによる情報検索

情報検索の分野においてはよく用いられる1-GramのTF-IDFを,n-Gramに拡張することは可能であるかについて検討した研究です.TF-IDFはTF(単語の出現頻度)とIDF(逆文書頻度)の掛け合わせによって定義されています.
SNSといった短期間に膨大な量の情報が表示される場合,IDFを計算することが困難であるため,生起確率の情報量によって推定するというアプローチを取っていました.また,TFの計算にはマルコフ性を仮定し,生起確率を計算しました.このアプローチによってn-Gram(実際には2-Gram)のTF-IDFを推定しました. 検証のための実験では,毎日新聞のデータを使用し,連続語を抽出し共起頻度を求めました.
その後,2-TF,2-IDFと推定2-TF,推定2-IDFを比較しました.結果,TF-IDFを1-Gramからn-Gramに拡張することにある程度成功していました.

学術情報検索における検索語を用いた論文の特性分析

学術論文を探すために用いた検索語を用いて,それらの論文を閲覧した目的を知るという研究です.そのために学術検索サービスCiNii Articlesのアクセスログや,ソーシャルメディア上で論文に言及したログを利用していました.
これらのデータをもとにいくつかの指標を作成し,論文を閲覧する目的の違いを明らかにしていました.また,論文のトピックを示す「内容指定語」によって,「面白さ」「著者」「バースト性」といった観点から各指標の違いについて分析しました.結果,バースト性に応じて論文を検索するユーザが存在することを明らかにしました.

博物館における鑑賞体験の記念品化を目的とする ナビゲーション端末操作ログからの印象深い展示物推定

博物館の鑑賞体験を,どのようにしたら印象深くすることができるかについて検討した研究です.博物館は展示物の多さや場所の広いことなどから,鑑賞体験後は印象に残らないという問題が存在します.この研究ではそうした問題を解決するため,興味の湧くようなポスターカードを提案しました.ポスターカードに載せる展示物を決めるため,博物館ナビゲーション端末のログデータを用いて,博物館の展示物における印象深さのランキングのアルゴリズムを作成しました.端末を用いたユーザの印象深さを推定するユーザ実験を行った結果,展示物の詳細画面を見る人ほど印象深いということが明らかにしました.しかし,十分な結果は得られなかったため,今後の課題としていました.

感想

初の学会発表がまさかのオンライン開催ということで,あまり実感が湧かなかったというのが正直な感想です.ですが,質疑応答の際は私の研究の甘い点をご指摘いただき,今後の研究の励みとなりました.また,自分の研究をわずかな時間で伝えるのは難しいと改めて痛感しました.

同じセッションで発表した方々は,それぞれ特色のある研究をしていて,情報検索は幅の広い研究分野であると感じました.次は現地で発表ができることを楽しみにしておきます.