研究内容紹介


理念:マイニング ホレ、ここホレ、そこホレ、やってみよう!

knowledge_data.gif

インターネット上のホームページ群は世界最大の知識の書物といえます。 人類はかってこれだけの知識の素を共有したことはありません。しかも我々はそこから膨大な量の情報を瞬時に集めることができます。 増え続けるWeb空間からどのようにすれば効率良く知識を獲得できるのでしょうか? 沢山ある情報をどのように組み合わせればより価値ある情報を作れるでしょうか? 知識の発見とデータの発見のサイクルを目指して研究を行っています。

What is like the Next Generation Search Engine?

My answer is "The question is wrong". I prepared a short exposition (20 page slieds). We'd like to hear your comment. Tell me what you think about Next Generation SE. "hirokawa at cc.kyushu-u.ac.jp".

Boot Strap 2013-03-05

文書とキーワードのように相互に関連するデータを表す2部グラフにおいて重要部分を反復で求める ブートストラッピング法が知られています。しかし、反復中に話題がずれるトピックドリフト問題が あります。そこで、反復の各ステップにおいて、上位K個の文書に限定することで、トピックドリフト を防ぐ方法を考案し、その有効性を検証しています。

boot strap.png

  • 廣川佐千男,制約付きブートストラップ法による特徴語抽出について,信学技報,Vol.111, No.119, NLC2011-13, pp.67-72, 2011
  • 特許出願2011-104418, 情報処理装置、情報処理方法及びプログラム

Milky Way 2013-03-05

図は、時間軸に注目しキーワードの変化を捉えたMilkyWay?システム7)です。1992年から2012年に発表されたe-learning関連の文献情報を対象に、時代による研究動向を天の川のように表示することで、個別の論文を見ていてもわからない概観を捕まえようとしています。

Milky Way.png

  • Brendan Flanagan, Chengjiu Yin, Sachio Hirokawa, Han-Yu Sung and Gwo-Jen Hwang,Analysing Research Trends of Mobile Learning with the Milky Way,Proc. 7th International Conference on Wireless, Mobile and Ubiquitous Technology in Education (WMUTE2012),pp.249-253,2012

Double Rank 2013-03-05

下の図も二次元表示は同じですが、表中のセルには件数だけでなく、特徴的キーワードを表示しています。この図は、観光関連ブログデータを対象として、ラーメンとうどんで検索し、それぞれの検索結果に現れる特徴的なオノマトペをダブルランク法で表示したものです。単純なキーワードでの分析でなく、感性的な分析を実現しようと思っています。

double rank.png

  • 特願2011-104418, 情報処理装置、情報処理方法及びプログラム,2011
  • 廣川 佐千男, 二つの観点に基く検索結果の分析方法Double Rankについて,検索,第1回テキストマイニング・シンポジウム,電子情報通信学会技術研究報告. NLC, 言語理解とコミュニケーション 111(119), pp.61-65, 2011
  • S. Hirokawa, J. Zeng, Comparison of Tourism Data using Double Ranking, Proc. SSNE, International Workshop on Innovative Tourism Informatics pp.67-72,2011

マトリックス検索エンジン

従来の検索エンジンでは、ユーザーのキーワードに対する検索結果を順位付きリストのような一次元表示しかできません。 我々のマトリックス検索システムでは、複数の観点からの分析を実現します。 ユーザーは2つの観点を選択すると、それぞれの観点に基づいた分類が行なわれ検索結果は2次元マップとして表示されます。 表示された各セルには、観点ごとに特徴語が自動的に抽出されているので、セルの解釈だけでなく、検索拡張や絞り込みのためのキーワードとして利用できます。さらに、各セルをクリックするだけでズーミング検索ができます。

  • デモシステム IEICE(電子情報通信学会):?
  • デモシステム ZSJ(日本動物学会):?

matrix.gif

Cross Tabulation 2013-03-05

マトリックス検索エンジンを改良し、二つの観点についてのクロス表として検索結果を表示するCross Tabulationを 作りました。下の図はこのを手法を文献検索に適用したものです。出版年、研究者、研究グループなどを分析軸とすることで、研究調査が効率化できます。

cross tabulation.png

B. Flanagan, C. Yin, S. Hirokawa, H.-Y. Sung, G.-J. Hwang, Analysing Research Trends of Mobile Learning with the Milky Way, Proc. 7th International Conference on Wireless, Mobile and Ubiquitous Technology in Education (WMUTE2012), pp.249-253, 2012

コンセプトグラフエンジン

コンセプト・グラフ・エンジンは文書群に現れる特徴語の概念的な上下関係を表す可視化システムです。 ユーザーが入力するキーワードを含む文書群を検索結果として求めるところまでは通常の検索エンジンと同じですが、コンセプト・グラフ・エンジンは検索結果のこれらの文書に含まれる特徴語を抽出します。 さらに、それら特徴語の間の概念的な上下関係を出現頻度にもとづき抽出し、グラフとして可視化します。 検索結果が数百件あったとしても、それらの文書でどのようなことがポイントになっているか大局的につかむことができます。 具体的な文書を読む前に、あるいは、検索結果をじっくり読んだ後で、概観をまとめたり分析するための強力なツールとなります。

デモシステムはこちら

concept_graph.gif

geta_3.gif いずれのシステムも 汎用連想検索エンジン GETA.を利用しています。

問い合わせ、所在地

大学院への進学相談、研究テーマや特許情報についての問い合わせ、あるいはデータ分析委託、共同研究、ビジネス相談など、お待ちしています。

廣川佐千男
住所: 〒812-8581 福岡市東区箱崎 6-10-1
九州大学情報基盤研究開発センター
TEL: 092-642-2301(研究室),2296(研究部)
FAX: 092-642-2294
MAIL: hirokawa @ cc.kyushu-u.ac.jp
URL: http://tml.cc.kyushu-u.ac.jp/

所在地をGooglemapで表示