iiWAS2019参加レポート(中野)

ミュンヘンの旧市庁舎。下の広場ではクリスマスマーケットが催されていました。

12/2~12/4にかけてミュンヘンで開催されました国際会議iiwas2019に、研究室同期の梅田と共に参加してきました。初めての国際学会参加であることや英語でプレゼンを行わないといけないことなど個人的に初めての経験ばかりで、ミュンヘンに滞在した6日間だけでかなりの人生経験ができたような気がします。

英語なんて大学受験以降ちゃんと勉強していない私にとって、発表はかなりの困難であり、ギリギリまで発表練習を続けていました。先生や他大学の先輩方に付き合っていただき前日の夜遅くまで文章やスライドを修正していました。

発表自体はなんとか乗り切りましたが、質疑応答では相手の質問の意図がなかなか汲み取れず、かなり苦労しました。外国から参加した方達は平均的に日本人以上に英語を話す能力があるのですが、出身地域によってかなりイントネーションに差があり、日本人英語ばかりで耳をならした私にとってはかなり聞き取り辛いものでした。それでも大きな問題なく?なんとか回答して乗り切ったので、自分の番が終わった瞬間にはかなり安堵したことを覚えています。

個人的にこの学会での一番の思い出は、他国の参加者の方と一緒に昼食をとったことです。質疑応答でうまく回答できなかった方に対してセッション終了後に声をかけたところ、昼食に誘ってもらい、その後1時間くらい会話しました。せっかく国際学会に参加したのだから異文化交流がしたいと思っていたので、たどたどしい会話でしたがコミュニケーションがとれたことはよかったと思います。

会場には軽食コーナーが設置されていて、お菓子やコーヒーがセッションの休憩中に食べれました。

学会発表論文レポート:セッション“classification techniques and application”

以下では学会で参加したセッションで発表されていたいくつかの論文についてまとめます。このセッションにおいては名前の通り、何らかの領域を対象に分類問題に取り組むという研究が報告されていました。英語力の問題で内容を完全に理解できていないかもしれませんが、理解できた範囲での率直な感想です。

Tourism application with CNN-Based Classification specialized for cultural information

旅行者のための注意喚起文を従来よりもユーザフレンドリーに表示しようという取り組みです。アプローチとして、注意喚起を行いたいスポットやランドマークをユーザが撮影することで、テキストが表示されるというアプリケーションを作成していました。手法としては対象となるランドマークなどをあらかじめ設定し、またそれに対応するテキストも用意したものを表示するというものであり、設定した各要素についてその文書の適切さを評価していました。

 個人的には対象となる要素の選定基準にやや疑問が残るように感じました。研究背景として外国人旅行者を設定するのであれば対象となるものは観光で訪れる場所あるいはそこに存在し、かつ着目してしかるべきものである必要があるはずで、その観点からすれば、富士山や原爆など、有名なランドマークでこそあれ、そこに背景となる前提を踏まえたときの妥当性はないように感じました。また、今回の研究で設定された要素は訪れる地域によってそれが利用可能な情報かどうかが依存し、一箇所における有用性はあまりないように思えたので、広範に利用可能な拡張ができれば面白いと感じました。

Fake News Classification Based on Subjective Language

フェイクニュースを主観的な言語を抽出することによって検出しようという研究です。この研究においてはユーザの興味を引くことを重視してその情報の信憑性があまり考慮されていない文書をフェイクニュースとして問題視し、それを自動的に取得することに着目しています。アプローチのベースラインは上述した主観的な言語に着目するということにつきます。主観的な用語のデータセットを用意し、それを含むニュースデータをフェイクニュース、そうでないものを適切なニュースであると評価するような分類器を作成し、その性能を評価していました。アプローチとして機械学習法を3パターンと、p@kでの評価を見ることで最適な方法の検討を行っていました。

 研究として、内容ではなく語句に着目したことで、内容評価における分類器の解釈の恣意性をさほど懸念する必要がないという点では良いアプローチではあるのかと思います。しかしながら、主観的な語句というものが文書自体にもたらす影響については決め打ちであるような印象を受けたので、そこをより検討するべきであるように思いました。

Building Classifier Models for on-off Javanese Character Recognition

ジャワ語の手書き文字を機械で自動認識させるためのアプローチに関する検討です。インドネシアなどの地域では公用語でないものの多くの話者のいるジャワ語ですが、その記法は一つの文字を3行に分割可能な記号の組み合わせで表現するものであり、またそれら自体も一見するとかなり類似しているように見えるため、機械での自動認識は困難であるそうです。そのため、本研究では手書き文字データをいかに自動認識させるかというタスクを、文字特性に合わせた画像分割を行なった上で、いくつかの機械学習法を用いて性能評価していました。結果として特別最適な手法が明らかになったわけではありませんでしたが、SVMを用いた場合に精度が著しく落ちるなど、手法による差異を発見できたことを収穫としていました。

 ジャワ語について私はあまり詳しくはありませんが、データセットとしてかなり年代を跨いだ文書を用いるなど、正解データの一貫性については疑問の残るアプローチをとっていました。昔の書籍などのデジタル化などが最終的な目標であることは理解できますが、あえてそうした文書を用いたことについてもう少し説明があっても良かったような気がします。

Movie Genres Classification using Collaborative Filtering

タイトルの通り、協調フィルタリングを用いて映画のジャンル分類を行おうという研究です。この研究ではある映画レビューサイトのレイティングスコアのみを利用し、各ユーザ毎のそれらに対する評価特性の差からジャンルを導きだそうというものです。基本的なアプローチとしてはスコアをベクトル化してk近傍法などを用いてその類似性を評価するものであり、スコアのみを利用したにも関わらずその分類性能において比較的高いF値を得られていたように思います。

 個人的には私の研究とアプローチは違えど同じ目的を持っているため、セッションの中では一番興味のある研究でした。レイティングスコアのみで映画ジャンルという多値の分類が行えることには関心しましたが、特別に独自のアプローチを用いたというようには感じられませんでした。

謝辞

学会参加にあたり、山本先生はもちろん、本当に多くの方にお世話になりました。すべての方にお礼を申し上げたいところですが、ここでは特に発表練習に夜遅くまで付き合ってくださった兵庫県立大学の高橋さんと村本さん、そして滞在3日目から体調を崩した私を気遣ってくれた同期の梅田くんに対して感謝を述べたいと思います。ありがとうございました。