Web検索結果における閲覧効率化のための分散表現を用いた既知度予測手法
山田 純平,北山 大輔
電子情報通信学会技術研究報告,Vol.119,No.201,pp.13-18,2019年9月,査読無
論文PDF
概要
近年,インターネットや情報端末の普及により,検索エンジンを利用したWeb検索の機会が増えている.これまでにも,Web検索をより便利にするための研究は数多くされてきた.しかしながら,効率の良いWeb検索をできないことは多々ある.そこで我々は,検索結果を無造作に閲覧していると訪問済みページと同じような内容で効率よく知識が得られない問題に着目した.この問題に対して,検索結果内の未訪問ページの内容に対し,含まれる情報と訪問済みページとの比較情報として既知度をユーザの閲覧判断基準として提示することで解決する.本稿では訪問済みページの語集合から含まれるトピックを階層的クラスタリングを用いて推定し,未訪問ページのスニペットの語集合からその内容を類似度で予想することで,その既知度合いを算出する手法を提案する.