Text Mining Studioがユーザーから支持される理由

Text Mining Studioの開発元のNTTデータ数理システム 岩本氏に
なぜText Mining Studioがユーザーから評価されているのかを伺いました。


Text Mining Studioの開発秘話をお聞かせください。


■看護・社会学・心理学ユーザーが導いたボタンでの簡単操作

当社自体、全社に渡って開発メンバーは理系出身者ばかりで、理工系ユーザーの方を対象としたツールを開発しておりました。

Text Mining Studioに関しては現在のようにこれほどまでに看護・社会学・心理学といった「理学工学系以外」のお客様にツールを使って頂けるということは、2006年にText Mining Studioをリリースするまでは誠に光栄ながら、「想定の範囲外」でスタッフ一同、感謝の想いでいっぱいです。

■2013年にはテキストマイニングツールで唯一「ソフトウェア賞受賞」

皆さまから、「ボタンでの簡単操作を!」とご要望をたくさんいただいたおかげで、2013年にはテキストマイニングツールでは唯一「ソフトウェア賞」を受賞いたしました。引き続き、操作性、価格、機能面、サポートなどにおいて皆様のお役にたてるよう開発を続けていきたいです。


Text Mining Studioと他のテキストマイニングソフトの大きな違いと優位点は?


■文章全体を見て最適化する、高精度な日本語処理機能

まずアピールできる点は、自社開発による高精度な日本語処理機能です。まずは前処理として、文字の羅列であるテキスト情報から単語を切り出す必要がありますが、未知語や業界依存のキーワードも、周囲の語の状況とあわせて文全体で最適になるような手法を適用することにより漏れなく抽出します。

■カスタマイズ可能な辞書機能

ユーザー様は結果を確認し、必要がある箇所のみ辞書機能でカスタマイズして頂ければよいようになっています。日本語処理機能の1つ「態度表現」も強力な機能で、テキストに潜む話者の困りごと・要望事項などの「態度」を簡単に抽出することができます。

■一本のソフトで完結するテキストマイニング

前処理が済みましたら、切り出したキーワード情報を用いていざ分析に移りますが、基本の集計機能の他に、全体を俯瞰する分析、テキスト以外の属性に着目した分析など多彩な分析機能を備えています。決して廉価なツールではありませんが、グラフの作成からレポーティングまで「これ1本」でテキストマイニングの必要な機能が完結するようにできていますので、自信を持ってお薦めしています。


なぜ、分析の核となる分析アルゴリズムを公開しているのでしょうか?


■アルゴリズムを透明化することで。ユーザーの利便性を高める

我々は、入力データから最終的なアウトプットを得るまでの過程がブラックボックスではいけないと思っています。開発メンバーによる手法の調査研究の結果、ユーザー様にとってこれは有益であるだろうと判断した手法を当社自身で作成し製品化しています。その過程で、都合の良いものは見せる、都合の悪いものは見せない‥‥といった曇りはあるべきではないと考えています。日本語解析処理の結果も、1語1語文法情報とあわせてほぼ全て見せています。

■エビデンスを重視する学術分野でも使われる

結果的に、アウトプットに対するエビデンスが必要となるアカデミック分野の場面において大変ご愛顧をいただけるという大変有難い状態になりましたが、これは当社の姿勢が間違っていなかったということを表しているものと考えています。


使っている方からの評価が高い機能は?

■直感的に分りやすいアウトプットの「ことばネットワーク」

分析機能の中では、直観的に分かりやすいアウトプットを作成する「ことばネットワーク」はご利用の場面が多いものになっています。テキスト内の話題の「かたまり」を図示するもので、人間の直感が正しいかどうかを検証するエビデンスとして、また予想していないような結果が得られた場合はそれ自体を新たな発見の示唆としてご活用いただけます。

■属性に着目し、特徴的な単語を抽出する「特徴分析」

性別や年齢等々の属性に着目し特徴的な単語を抽出する「特徴分析」も使い易い機能です。回答者属性の層別、また何らかの介入の前後、など層別の比較を行いたい場合には非常に有用です。


ぜひ活用してほしいオススメの機能は?


■「グルーピング」機能でより深い分析を

各種の分析機能を活用することで、キーワードを対象とした分析は可能ですが、さらなる分析の深化のため、ことばの意味的なまとめ上げを行う「グルーピング」という機能をご用意しています。これを用いて、テキストの内容から意味的まとめ上げを行ったものを属性として新たに付与する、その属性と絡めてまた異なるテキストを分析する、……というように縦横にデータ内を泳ぎ回ることができます。


テキストデータを扱う研究者に共通する、分析における悩みはどんなものがありますか?


■枠におさまらないデータの整形

そもそも、分析対象となるデータをどういったフォーマットで準備すればよいかというご質問をいただくことが多いです。例えば、自由回答を含むようなアンケートのデータのようなものでしたら、表計算ソフトの上で1行が1人の回答内容、そして設問毎に列を分けるといった形式に自ずとたどり着くものですが、分析をお考えのデータはインタビューデータだったり論文データだったりして、この枠に自然におさまらないようなものも多いです。Text Mining Studioでは、データ1件の単位と項目が明確に確定できることが必要なので、やはりExcelやCSV形式といった表形式のデータを分析の対象としています。

■体験セミナーでデータ整形に関する相談も

Text Mining Studio の導入をお考えの方向けに、実際に製品を触って体験いただけるセミナーを毎月開催しており、データをご持参いただければ、セミナー後の個別相談でツールの利用にあたりどういった整形を行うことが妥当かというご相談も承っています。

■購入後のスキルアップセミナー

体験セミナーのほか、ユーザー様向けにより発展的な内容を解説させていただくスキルアップのためのセミナーも開催しており、こちらでみっちり実習も含めて習得していただけますので、ぜひご活用いただければと思っています。


サポートが好評とのことですが、どういった点が評価されていますか?


■質問から1営業日以内に回答

サポートは、メールによるご質問を頂いてから、ツールの開発者から直接1営業日以内に回答するという方針で運営しており、迅速な対応で助かったというお声を多く頂いています。ユーザーの皆様のデータに依存した分析対応や解釈のお手伝いについては、有償のサービスではありますが個別に分析のコンサルティングとしてお受けいたします。

■お客様のデータに基づいたコンサルティングも

分析コンサルティングでは、お客様と当社スタッフが実際にText Mining Studio とデータがインストールされたPCを前にして、操作を行いながらディスカッションをさせていただき分析結果を導き出すという作業を一緒に行いますので、皆様からは論文執筆の際にご利用頂いており、ほとんどがリピーターの方によるご利用です。こちらもご好評を頂いており、繁忙期には恐れ入りますが受付を締め切らざるを得ない状況になることもあります。

お客様と共に考えることで、当社スタッフもお客様の問題領域に依存した知識をその場で共有できますし、お客様にとってもツールの利用方法や分析ノウハウを残すことができ、有意義と考えています。



Text Mining Studioはどんな方におすすめですか?


■アンケートはもちろん、研究動向を把握するための論文分析にも

アンケートやインタビューのテキストから、回答者の心情や困りごと、要望事項などを導き出したいといった利用においては、Text Mining Studioは最適な道具ではないかと思います。また、ある分野の論文そのものを入力データとして、業界動向・研究動向を把握するための論文分析の場面でも威力を発揮します。当社Webサイトでは、実際にText Mining Studioを用いたユーザー様の研究成果も数多く紹介しておりますので、ぜひご参照いただければと思います。




Text Mining Studioのページに戻る