データマイニング…欲しい商品のレビューを簡単・無料で分析?!

今回は、データマイニングがどうのこうのというような専門的なお話ではなく、データマイニングにより、商品のレビューを(ちょっと大げさですが)分析して冷静な判断で、商品を見極める一助になればと思ってまとめています(偏った評価の商品で信じたいものを信じて失敗した経験があります)。

欲しい商品があると、つい高い評価のレビューばかりを見がちになったり、逆に評価の低いレビューを気にしたり、冷静な判断がしづらくなっていませんか?

そんなあなたに、客観的な判断がしやすくなるように、簡単に無料で利用できるテキストマイニングツールをご紹介したいと思います。

データマイニングとは

データマイニングって聞いても、雰囲気はわかるけど、はっきりわからないという人も多いのではないでしょうか?

取り敢えず、言葉の定義を確認しておきましょう。

データマイニング(英語: Data mining)とは、統計学、パターン認識、人工知能等のデータ解析の技法を大量のデータに網羅的に適用することで知識を取り出す技術のことである。DMと略して呼ばれる事もある。通常のデータの扱い方からは想像が及びにくい、ヒューリスティク(heuristic、発見的)な知識獲得が可能であるという期待を含意していることが多い。とくにテキストを対象とするものをテキストマイニング、そのなかでもウェブページを対象にしたものをウェブマイニングと呼ぶ。

Wikipediaより引用

これから実際にレビュー情報をテキストマイニングしてみたいと思いますが、どのようになるのかをまず見てみましょう。

下の映像は、「共起キーワード」について見ています。

テキストマイニングツールを無料で利用できる

商品レビューや特許文献などをテキストマイニングできる「ユーザーローカル テキストマイニングツール」を利用してみます。

この無料ツールの良いところは、アマゾンや楽天などの商品レビュー用の整形ツールが用意されていることです。

整形を行ったのち、そのデータをそのままテキストマイニングすることができます。

https://textmining.userlocal.jp/parser

余談ですが、データはなんとか用意できても、そのテキストの塊から、必要な部分を抽出して不要な部分を処分するのは大変なものです。

実は、2014年にあったAKB48握手会傷害事件の時に、ツイッターでの反応をデータマイニングしてみようと思い立ち、必要なデータを整形したのですが、非常に手間がかかりました。

その時に整形ツールの必要性を感じたので、そのままデータマイニングソフトとともにお蔵入りしてしまいました。

アマゾンレビューを見てみる

例えばアマゾンで何かを購入しようとしたら、商品レビューを見るのは、割と普通のことになっているでしょう。

知っている商品ならば、レビューを一つ一つ見ても良し悪しがなんとなくわかると思います。

しかし、あまり知らない商品の場合、レビューを読んでも振り回されることがあります。

もちろん、レビューの真偽やレビュアーの良し悪しもあり、特徴的なレビューの印象が強かったりすると、判断ができなくなってしまう人もいるでしょう。

今回は、効く人もいれば、そうではない人もいそうなビタミン剤のレビューで試してみたいと思います。

実際に分析してみる

データテキストの収集・整形
  1. 選んだ商品の全てのレビューを見ることができるページから、ここだけ少し手間がかかりますが、全ページをコピーして抽出します。
  2. 整形ページの「整形前のテキスト」フォーム内に、不要な部分を含む丸ごと(7ページ約70件分のデータをページ丸ごと)ペーストします。
  3. 「テキストを整形する」ボタンを押すと、スグに下の「整形後のテキスト」欄に転記されるので、一応確認した後、「整形後のテキストでテキストマイニングする」ボタンを押して、ほんの少し待てば結果が表示されます。
テキストマイニング

見たり、共起キーワードをいじってみると、なんとなく雰囲気がわかると思います。

詳しい説明が必要な場合は、分析結果ページの説明などを参考にしてください。

また、語句の説明などを別記事にしたいと思います。

まとめ

データマイニングにより、商品のレビューをなるべく客観的にみてみようと思います。

データマイニングとは

ザックリと言えば、大量のデータから知識を取り出す技術で、テキストを対象にするのがテキストマイニングになります。

テキストマイニング無料ツールで分析

ユーザーローカル テキストマイニングツール」は、アマゾンや楽天などの商品レビュー用の整形ツールが用意されていて、そのデータをそのままテキストマイニングすることができます。

データの収集・整形は簡単にできる
  1. 全ページをコピーして抽出。
  2. 「整形前のテキスト」フォームにペースト。
  3. 「テキストを整形する」ボタンを押す。
  4. 「整形後のテキスト」欄に転記される。
  5. 「整形後のテキストでテキストマイニングする」ボタンを押す。

すると結果が表示されます。