DEIM2020 参加レポート(齊藤)

修士1年の齊藤です。2020年の3/2~3/4に開催された、データ工学と情報マネジメントに関する学会であるDEIM2020に参加し、研究を発表しました。

コロナウイルス感染症の影響により、口頭発表やポスター発表など全てをオンラインで開催することになりました。
https://www3.nhk.or.jp/news/html/20200303/k10012310661000.html

オフラインでの開催と違う点もありましたが、様々な発表を見やすく、質疑応答なども問題なく行うことができ良かったです。

以下に研究の紹介をさせていただきます。

自分の発表したセッションの研究紹介

「QAサイトにおける質問応答に着目した気づきを促す問いかけの分析」(自研究)

あるトピックについて、知識不足や考慮すべき点の不足、また不足していたことを認識させるために問いかけ形式で気づきを促すことを目標とした研究です。
今回は、気づきを促す問いかけ文の要素分析のために、Yahoo!知恵袋のデータを利用しました。質問者が回答者に送ることが出来るお礼コメントの内容から、質問者が回答の内容から気づきを得たか判断し、気づきを得た回答にある問いかけ文を取得し、単語の系列パターンを分析しました。

「質問のパターンに着目した医療分野におけるVisual QAの検討」

Visual QAと呼ばれる、与えられた画像に関する質問に回答する課題について、医療分野で利用するための研究です。
例えば、MRIで撮影した画像と「○○病の前兆がありますか?」といった質問を入力することで画像処理と自然言語処理を用いて回答を導きます。
現在、医療分野では専門性の高さからデータセットが少ない点が課題になっています。
既存研究ではタスクを4つのカテゴリに分けていますが、より詳細に7つにカテゴリ分けを行い、問題を単純なものに落とし込み精度を向上させています。

「質問応答の教師なしドメイン適応:機械読解と言語モデルのマルチタスク学習」

機械読解と呼ばれる、与えられた文章を理解して関係する質問に回答するタスクの研究です。
教師データとして使った文章に含まれていないドメイン(話題)については読解精度が下がる点について、言語モデルを用意することで理解させたいドメインの教師データが無くても精度を保つ手法を提案しています。

「CQAコンテンツからの類似する悩みの発見」

Yahoo!知恵袋上で悩みを相談している投稿者が、共感できる質問を取得する研究です。悩みの解決や悩みを抱える人へのケアには共感する人の存在が必要と考え、QAサイト上では似た立場の人を見つけることでサポートを実現します。
悩みの状況が似ている相談の組み合わせをクラウドソーシングで集め、BERTを用いて類似した悩みを取得するモデルを作成しました。

「cQAに登場するアイテムの特徴に注目した使用目的をクエリとするアイテム検索」

ネット通販で商品を検索する際に、スペックではなく使用目的(カメラであれば、運動会や風景の撮影といった状況)に注目し、似た使用目的に適した商品をランキングに並べる手法を提案しています。その商品について詳しくないと、スペックを確認して商品が向いている目的を知ることが出来ないという問題背景の設定が非常に面白かったです。

また、DEIMは学生の発表だけでなく、企業の技術報告も行われました。
今回は、LINEのデータ分析についての技術報告の紹介をします。

【技術報告】コミュニケーションアプリ「LINE」における実践的データサイエンス

LINEのデータサイエンスチームの仕事紹介として、ユーザーへの影響を分析しながらLINEアプリのUI変更を行った例を紹介していました。友達追加画面のUIを簡単なものに変更することで友達追加数が減少するという結果が出たが、新しいUIへの慣れによる効果を推定することで慣れによって減少幅が緩和されることが分かりました。

詳しくは、LINE公式のブログにて紹介されております。
https://engineering.linecorp.com/ja/blog/deim2020-report/