COREPON.COM 株式会社 組織活性化研究所
ANALYSIS SOLUTION CASE STUDY VOICE INFORMATION
コラム 先生のやぶにらみ セミナー・講演 最新情報 SECRETARY DESK
シソーラス
TOPANALYSISデータマイニングシソーラス第1回
シソーラス第1回
←なし →なし
自動「シソーラス」が完成
 角川基金のほかにもご報告があります。テキストマイニング処理でいちばんヤッカイな作業、それは同義語のまとめや発言の類似性を検討することですが、それを自動化できました。自動シソーラスの完成です。


 シソーラス(意味辞書)とはコトバの処理箱ともいわれ、意味的にコトバを分類する機能をいいます。自然言語のテキストマイニング処理では、これをパスしないことには何ら進めなかった重大な箇所です。
 その問題を、我々はやっと論理的に理科学的にもスルー(解決)しました。処理の仕方はあくまでも組織活性化研究所的なもので、むろんこれから数十年後も、まったくロジカルに近道かどうかは現在まだとてもいえませんが、とにかく一応解決でき、それが顧客からは「正解」だったとの評価をえました。


 現在のテキストマイニングは技術的にいまだ幼稚としかいいようがなく、「形態素」といわれる方法で、いわば根性論で機械的に分割していくだけなのです。そこでは「辞書」として登録した単語が何回使用されたかをカウントすることで、なんとなく「世間の人々のコトバ使いが理解できるのでないか」という大甘な前提に立ちます。


 ところが顧客からの意見はそんなに単純ではないのです。
 あるメーカーは、そうしたテキトウなテキストマイニング技術で採取した発見で、顧客の一番の意見は「欲しい」だと分かったので、増産に踏み切りました。ところがお客様の声の真実は「○○して欲しい」であり、改善に対する要望だったのです。お客様の声を正しく聞けず、まちがった判断をしてしまったのです。


 あるクルマメーカーでも同様です。
 もっとも多かった「燃費」というコトバも、それが「燃費がいい」といいたかったのか、「燃費を気にしない」だったのか、結局は原文にもどって確認しなくてはならないのです。でも数万人の意見をどうやって。


 こうした多数の苦労をひとつずつ解決していくうちに、たとえ数万人という大勢の発言が自動的に意味のとれる熟語単位でカットされ(通常のテキストマイニングは単語単位)、それらが共通の意味でまとまります。


 非常に便利になりました。
ページの先頭へ
(C) Soshiki-Kasseika Kenkyusho Inc.