珍スポット検索のためのランキング手法の検討

山本研究室学部4年の堀内です。 第11回「データ工学と情報マネジメントに関するシンポジウム(DEIM2019)」 にて発表した卒業研究について紹介します。

本稿では、珍スポットのランドマーク検索手法の提案を行う。提案手法は、既に珍スポットとわかっているランドマーク名でウェブ検索した結果の文書集合のスニペットおよび、タイトルの形態素解析を行い、文書中に含まれる形容詞の割合が大きいものを珍スポット特有の形容詞とする。その上で、ランドマーク名でウェブ検索した時の文書集合中に珍スポット特有の形容詞が含まれる割合を分析し、その割合が大きいものを珍スポットとなる 可能性が高いと見なす。

本研究では、珍スポットが多いとされる伊豆を取り上げ, 提案シ ステムの評価実験を行った。

ベースラインとなる手法は以下の2手法である。

・“ランドマーク名+ 珍スポット”でウェブ 検索したときの検索結果ヒット数順のリスト

・“ランドマーク名”でウェブ検索したときの 検索結果ヒット数順のリスト

その結果、提案システムがベースラインの手法よりもランキ ングの精度が高いことを明らかにした。