Wikipediaを用いた観光オブジェクトの属性抽出に基づく対応Webページの特定手法
峯 祥平,北山 大輔
第7回データ工学と情報マネジメントに関するフォーラム(DEIM Forum 2015),G7-2,福島県,2015年3月,査読無
論文PDF
概要
一般に,ユーザが観光の計画を立てる際,ガイドブックやWebから情報を収集するが,観光に関する情報は多数存在し情報同士の関連付けがされてないことが多いため,情報収集のために手動で閲覧し取捨選択しなければならない.こういった手間の削減のために,ユーザの定型的な行動を他オブジェクトに対しても適応することで,手軽に情報を収集できるスマートスクラップブックシステムを提案した.本稿では,ユーザが,あるWebサイトにおける概要やアクセス情報などのWebページの一部を保存した場合,他オブジェクトのWebサイトにおいて,保存したWebページの一部に対応するWebページを特定する手法を提案する.具体的には,種類に応じた対応情報の特定を行う.ユーザが手動で保存した内容と,その観光オブジェクトに対応するWikipediaページの概要,歴史などの各項目との類似度を測る.最も類似する項目名を保存内容の属性として抽出する.次に,他オブジェクトのWikipediaページ内にある,該当属性の項目内容と類似するWebページを抽出する.