データサイエンス入門 上田雅夫、後藤正幸 著

2000年頃のデータマイニングの分析対象は主に顧客の購買データだったが、最近のデータサイエンスはソーシャルメディアの文字、画像、音声、位置情報など多岐にわたる。

かつてのデータ集めは高コストだったが、スマホの普及で安価に集まられるようになった。

材料であるデータを前に分析の目的を明確化し、目的にあった統計手法やグラフを選択して可視化していく。同じデータでも全体でみたときと、カテゴリーごとに分析したときで結果が異なることがあるので注意する。