0番染色体

科学は全世界を照らす光である

Googleトレンド「人気度マイナス」の謎

皆さんは,Googleトレンドを利用されたことがあるでしょうか.Googleトレンドは,文字通り「Googleで検索されたトピックのトレンドを確認する」ためのツールです.おそらくはSEO対策であったり,世の中の動向を分析してビジネス戦略に活かすなどの利用を想定して開始されたサービスなのだろうと思いますが,そうしたこととは無縁な個人ユーザーとしてデータを眺めるだけでもなかなか面白いものです.

さて,このGoogleトレンドなのですが,直感的な操作で使いやすいようには設計されているものの,ときに不可解な表示が見られることがあるようです.今回は,そうした例をひとつ紹介していくことにします.

トレンドグラフ

まずは最も単純で基本的と思われる使い方をしてみます.Googleトレンドの右上の「トレンド」をクリックし,「調べる」を選択します.

Googleトレンドのメニュー

すると,ページが切り替わって画面上方に「キーワードを追加」というダイアログが現れるので,ここに適当なキーワードを入力します.私は試しに,「Google」と入力してみることにしました.

キーワードにGoogleを追加

ここでEnterを押すと次のようなグラフが表示されます.

これが「トレンドグラフ」と呼ばれるものです.ただし,日本語では「人気度の動向」と表現されているようです.これに関するGoogleの簡易的なヘルプ *1 では以下のような説明がなされています.

チャートの最高点を基準として検索インタレストを表した場合の数値です。指定された地域と期間における検索の10%が「ピザ」で、この値が最大値であれば、この数値が100となります。これは絶対的な検索ボリュームを表しているわけではありません。

「検索インタレスト」という用語が少々わかりにくいですが,簡単に言うと「指定期間中における指定キーワードの検索量(回数)を,最高点を100とする相対値で表している」ということになるでしょうか.なるほど,確かに最高点(上のグラフの2014年9月地点)では数値が100となっており *2 ,他に上記の説明と矛盾する不自然な部分も見受けられません.そして,「『Google』というキーワードの検索回数は2004年以来,全体的に右肩上がりではあるが,ここ数年は頭打ちの状態のようである」ということを視覚的に捉えることができます.

「人気度」なのに「負の値」?!

次に,前節とは異なり不自然な結果を生む状況をご説明しましょう.

今度も画面右上の「トレンド」をクリックし,「調べる」を選択するところまでは同じです.次に,画面上方の「すべてのカテゴリ」と書かれた部分をクリックし,適当なカテゴリを選択します.私は,ひとまず本ブログのテーマである「科学」を選択することにしました *3

Googleトレンドのカテゴリ選択ボタン

すると,今度は次のようなグラフが現れます.

さきほど登場したグラフとまったく同じタイトル(英語では「トレンドグラフ」,日本語では「人気度の動向」)がついていますが,明らかにおかしな点があります.このグラフに関する日本語の簡易ヘルプを見ても,さきほどとまったく同様のことが書かれています.しかし,今度はあからさまにその説明と表示されているグラフが矛盾しています.どう矛盾しているのか,念のため具体的に述べておきます.

  • 最高点が100でない
  • 負の値をとっている
  • 数字の末尾に%が付いている

どういうことなのでしょうか.

簡易な日本語のヘルプでは埒が明かないので,英語版のヘルプも見てみましたが,上記と同じ説明とあとは本件とは無関係な説明ばかりでこれも役に立ちません.

Googleの提供するヘルプから必要な情報が得られなかったので外部サイトを探してみたところ,意外なところに答えを見つけることができました.2年ほど前に投稿されたブログ記事中に前述した英語版ヘルプの「邦訳」が掲載されているのですが,それを見る限り当該ヘルプページには「現在では存在しない記述」が存在していたようなのです.その部分を引用してみます.

カテゴリフィルタを適用すると別のグラフになります。このグラフはグラフの最初の日(またはデータが存在する最初の日)に対しての成長の度合いをパーセント表示して、期間を通じての変化を見せるものです。これがカテゴリ比較のグラフでy軸に0〜100のラベルの代わりに、始まりを0として-100%または+100%の範囲のラベルが表示される理由です。
About Trends Graphs - Trends Help

「カテゴリフィルタを適用する」というのは,さきほど「すべてのカテゴリ」と書かれた部分からカテゴリを選択した操作を指すものと思われます.これで,2つ目のグラフについても矛盾なく説明することができます.

Googleに対する疑問

Googleは様々なサービスを提供してくれる優良な企業で,私も日々お世話になってはおりますが,本件に関しては投げつけたい疑問がいくつもあります.

  • 何のために「カテゴリ」に関するグラフだけ「成長の度合いをパーセント表示」する必要があったのか
  • なぜまったく異なる種類のグラフに「トレンドグラフ(人気度の動向)」という同じタイトルを与えたのか
  • どうして元々は存在したヘルプの記述を削除(もしくはわかりにくいところに移動?)したのか

まったくもって意味がわからないです.理解に苦しみます.

我々が気をつけるべきこと

よく言われることですが,人間は数字やデータというものに元来惑わされやすい動物です.しっかりと目を開いて見極めない限りは,数字やデータを前にするとあっという間に間違った解釈を行ってしまいがちです.だからこそ,そうしたものに触れるときには細心の注意を払う必要があります.

まず,「データを見る」ときにはそのデータが「何の,どのような」データであるのかをしっかりと確認する必要があります.場合によっては,「どのようにして収集された」データなのかまで調べる必要があるでしょう.それらがはっきりしないうちは,そのデータの解釈にとりかかるべきではありません.今回本記事で指摘したGoogleトレンドのトレンドグラフの問題が,(Googleトレンドに関する説明記事はたくさんあるにも関わらず)他のサイトではほとんど話題にされていないことに対して,私は非常に危機感を覚えます.データを前にしたときは「常に疑ってかかる」という姿勢を忘れてはいけないと思います.

次に,我々が「(視覚)データを作る」側に立ったときは,決してGoogleの真似をすべきではありません.第一に,必要もないのに対象の違いによってグラフの書き方を変えることはしない方がわかりやすいでしょう.どうしても別の種類のグラフを用いる必要がある場合でも,はっきりと「別物」であることを明示した上で,間違っても「同一のタイトルをつける」などということはするべきでないです.

データを相手にするときは,「自分が勘違いをしない」こと,「相手になるべく勘違いをさせないように配慮すること」が極めて重要です.そうしたことにさえ注意を払っていれば,データは人間にとって非常に強力な武器となり得ます.ベタな結論ですが,これはとても重要かつしばしば疎かにされてしまうことなので何度でも注意喚起するに値します.あのGoogleでさえ,ときとして守れていないぐらいなのですから.

*1:Googleトレンドには日本語の完全なヘルプは用意されていないようです.そのため,日本語で読むことができるのは一部のごく簡素なものに留まり,詳細については英語のヘルプを読む必要があります.

*2:グラフ上の任意の場所にマウスポインタをもっていくと具体的な数値が表示されるので確かめることができます.

*3:「『科学がテーマ』とか言いながら,最近はPC系の記事しか書いてないじゃないか!」というご指摘はもっともですが,今はわきにおいておくこととします.