インフォメーションゲインSEOとは?情報利得スコアを改善してコンテンツを最適化する方法
この記事で分かること
- インフォメーションゲイン(情報利得)とは?
- Googleが情報利得スコアを導入した背景
- 情報利得スコアを改善する方法
特定のキーワードに対してコンテンツを関連付け、最適化することは、2023年現在、SEO界隈で主流なテクニックとなっています。
しかし、他のサイトでも提供しているような模倣的なコンテンツを公開した場合、必ずしも検索エンジンで上位表示されるとは限りません。
また、コンテンツを検索エンジンに対して最適化したいという考えが先行してしまい、ユーザーのことを考えずに、コンテンツ最適化ツールなどが提案するキーワードやフレーズなどを無闇にページに盛り込んでいないでしょうか?
著者もコンテンツ最適化ツールを普段よく使用しますが、使い方を間違えるとSEOに悪影響を及ぼすことがあります。
今回紹介するインフォメーションゲイン(情報利得)スコアは、検索エンジンが複数のコンテンツデータを評価、比較する際に使用される重要な要素となります。
情報利得スコアが高いコンテンツは、情報利得スコアが低いページよりも検索結果で上位に表示される傾向があります。
インフォメーションゲイン(情報利得)とは?
情報利得スコアとは、特定のページが他のページよりも情報が多く含まれていることを示す指標のようなものです。
海外の多くのSEO専門家が、情報利得スコアの概念や重要性を言及しており、下記の動画はSEO Notebookというサイトを運営しているスティーブ・トス(Steve Toth)氏がYouTubeで情報利得スコアについて説明している動画になります。
コンテンツ内のエンティティを正しい情報でリンクすることは、Googleにとって著者がその分野の専門家であり、関連するコンテンツが他の類似コンテンツよりも多くの情報(固有な情報利得スコア)を含んでいることを意味します。
How to Rank #1 for BIG Keywords, Information Gain Score, and Other SEO Strategies with Steve Tothの動画内における言及内容を一部翻訳
情報利得とは、変換前と変換後のデータセットのエントロピーを比較したものであり、データセットの変換は、機械学習の分野における決定木分析(ディシジョンツリー)のトレーニングによく使用されています。
SEOにおいての情報利得スコアは、検索エンジンのアルゴリズムが、そのコンテンツからどれだけ多くの知識を得られるかどうかで決定されます。
情報利得スコアは、同じトピックに関する他のソースを見たことがある人に、あるソースがどれだけ多くの情報をもたらすかを示すものです。
情報利得スコアが高ければ高いほど、検索結果で上位を獲得できる可能性が高くなります。
情報利得スコアはGoogleが特許として取得している技術
この情報利得スコア(Information Gain Score)の特許出願は、以下のサイトで見ることができます。
- Google特許のタイトル:リンク情報利得の文脈推定
- 出版物番号:WO2020081082
- 発行年月日:2020年4月23日
- 国際出願日:2018年10月18日
- 国際出願番号:PCT/US2018/056483
- 申請者:GOOGLE LLC
- 発明者:Victor Carbune, Pedro Gonnet Anders
Google特許抄録
下記は、リンク情報利得の文脈推定の特許抄録を翻訳し、要約したものになります。
本明細書では、ユーザが関心を持つ1つ以上の文書について情報利得スコアを決定し、情報利得スコアに基づいて文書から情報を提示するための技術が説明される。所与の文書に対する情報利得スコアは、ユーザが以前に閲覧した文書に含まれる情報を超えて文書に含まれる追加情報を示す。いくつかの実装では、情報利得スコアは、情報利得スコアを生成する機械学習モデルにわたって文書からのデータを適用することによって、1つまたは複数の文書について決定され得る。一組の文書の情報利得スコアに基づいて、ユーザが文書を閲覧した場合にユーザが達成できる可能性の高い情報利得を反映する方法で、文書をユーザに提供することができる。
WO2020081082 – CONTEXTUAL ESTIMATION OF LINK INFORMATION GAINの一部を翻訳および要約
この機械学習モデルによるGoogle特許は、様々なユーザーに対して、同じような検索結果ばかりを表示しないようにするための重要な技術になります。
Googleが情報利得スコアを導入した理由
Googleが情報利得スコアの特許を導入したのは、SEO業界が相関ツールを使用することに現実的な問題があったためです。
過去数年間、SEOコミュニティの間では、コンテンツの作成時に、現在の検索結果で上位表示されているコンテンツを模倣することが主流になっていました。
しかし、それがGoogleにどのような問題をもたらすか、考えてみてください。
以下は、情報利得スコアの特許ページ内に記載されている文章の要約です。
ユーザーの要求または関心に応じ、ユーザーは、最初の文書または一連の文書で同様、もしくは類似の情報を既に見た後、2番目の文書を見ることにあまり関心を持たないかもしれません。
WO2020081082 – CONTEXTUAL ESTIMATION OF LINK INFORMATION GAINの一部を翻訳および要約
例えば、検索順位で1位のコンテンツを誰もが真似して公開した場合、ユーザーはGoogleが提供する検索結果に対して良い印象は受けないでしょう。
検索結果1位のページを見たあとに、次に2位のページをクリックし、そこでも1位のサイトと似たようなページ内容だった場合、ユーザーは同様の印象を受けると思います。
現在上位表示されているページを参考にするというSEOのテクニックは、もちろん今でも有効な手段にはなりますが、後発のページがそれだけで上位表示を行うのは難しく(Googleが好まないため)、ページの情報利得スコアを向上させる必要があります。
SEOにおける情報利得スコアの重要性
情報利得スコアの概念を理解することは、検索時にユーザーの検索意図を満たすことにつながるため、SEO対策には欠かせません。
既に検索結果の上位に表示されているページを参考にした模倣的なコンテンツや、相関ツールを使ってコンテンツスコアを最適化したものを展開しても、既存のデータセットにある情報利得スコアに合わせるだけになり、良い検索順位を得ることは難しくなります。
記事の冒頭でも説明しましたが、SEOの情報利得スコアを決定する鍵は、変換前と変換後のデータセットのエントロピーを比較することです。
作成したコンテンツが素晴らしく、検索の意図に答えていれば、ユーザーはそのページで時間を費やすと考えられます。
特に検索キーワードが複雑な答えを必要とする場合、提供される情報利得スコアが多ければ多いほど、ユーザーはその記事やサイトそのものに長く滞在します。
Googleを使って何かを探す人は、検索エンジンに特定のキーワードを入力し、必要な情報を見つけることを期待しています。
検索に関連する質問に答えを提供するのはSEOの本質であり、そのトピックに関してユーザーが抱えている他の質問にも答えを事前に用意しておく必要があります。
ユーザーの質問に簡潔に答えを提供できるかどうかが、コンテンツマーケティング全体の成功に影響します。
これは、既に市場に出回っているような使い古されたホワイトハットなコンテンツ戦略に聞こえますが、自身のサイトを訪れるユーザー体験、ユーザー行動がいかに重要だということを、改めて考えさせられる良い機会となります。
情報利得スコアを向上させる方法
ここからは、SEO対策で情報利得スコアを向上させる方法をいくつかご紹介していきます。
差別化キーワードを使用する
差別化キーワードとは、その名の通り、競合するWebサイトとコンテンツを差別化するためのユニークなキーワードを指します。
Googleアルゴリズムは、どのページがより専門的で、トピックに対して最適な回答を用意しているかどうかを下記の要因で判断します。
- 既存で上位表示されているページ内のキーワードやフレーズの一致率、使用率(相関的な要因)
- 既存で上位表示されているページ内で使用されていないキーワードやフレーズが追加されている(差別化的な要因)
1つ注意点として、ここで説明している差別化キーワードというのは、一般的な関連キーワードとは若干異なります。
長年、SEOはキーワードが中心でしたが、Googleのランキング要因に新たな要素が加わっており、それはエンティティです。
ここで説明している差別化キーワードを追加するという考えは、トピックをサポートするエンティティを追加で含めるという意味になります。
Googleは、エンティティを「特異で、ユニークで、明確に定義され、区別できるものである」と定義しています。
エンティティは、物理的な物体である必要はなく、キーワードのように特定の単語やフレーズである必要もありません。
トピックをサポートするエンティティの例としては下記のようなものになります。
- 人物
- 地名
- ブランド
- 企業名
- 色
- 日付
- 数字
このようにトピックをサポートする様々なエンティティを含めることにより、競合ページよりも情報利得スコア高いとGoogleに示す明確なシグナルとなり、結果的にページの信頼性が高まることにつながります。
自然言語処理の分野で、高い顕著性スコアを持つエンティティを既存のページに含めることができれば、コンテンツが上位表示できる可能性が高まります。
SEOと顕著性の関連性について初めて聞いたという方は、下記の記事で詳しく解説しているので是非読んでみてください。
競合他社のコンテンツギャップを分析する
Googleで上位表示を行うには、競合サイトのコンテンツがカバーしていない情報(コンテンツギャップ)を特定する必要があります。
コンテンツギャップを特定する際は、キーワードの検索結果トップ10を手動で分析する必要があり非常に時間がかかりますが、やるべき作業の1つです。
情報利得スコアを改善するには、競合他社のコンテンツを網羅するだけでなく、競合他社でさえカバーしきれていない関連情報を自身のコンテンツに追加する必要があります。
ユーザーが検索している質問を見つける
インターネット上で、ユーザーが実際に質問していることに答えることは、トピックの専門性をGoogleに示す良いシグナルになります。
コンテンツのトピックに関するよくある質問(Q&A)を追加することによって、ユーザーの検索意図を満たすことができ、情報利得スコアを増やすことにつながります。
コンテンツの読者は、疑問に対する答えを探しており、そのような疑問に対して記事内で答えをすべて提供することができれば、コンテンツマーケティングの成功にプラスの効果をもたらすことができます。
ユーザーの質問を発見する方法としては、Googleの検索結果で表示されたページを一度クリックし、ブラウザバックを行うと表示される「他の人はこちらも検索」欄に表示されるキーワードから取得するのが最適です。
その他の手段でいうと、TwitterやInstagramなどのSNSや、Yahoo!知恵袋、教えて!gooなどのQ&Aサービスもユーザーのリアルな悩みや疑問を確認できるので参考にすることが可能です。
また、FAQの構造化データをページに組み込むと、検索エンジンの結果ページでより大きな存在感を示すことができ、より多くの人がクリックするようになるメリットがあります。
このようにページ内によくある質問やFAQの構造化データを追加することで、検索エンジンに対して良い評価を獲得することができます。
関連するトピックを展開する
Googleの検索エンジンは現在、キーワードではなくトピックに焦点を当てて評価を行うように変化しています。
特定のトピックに対して関連した複数の情報を提供しているサイトは、結果的にコンテンツ全体の専門性と信頼性を向上させ、ユーザーと検索エンジンの両方に良い影響を与えてくれます。
まず検索エンジンのクローラーがサイトを訪問した際、このサイトがどのようなコンテンツを提供しているかを確認します。
サイトの構成要素である
- タイトル
- 見出し
- 段落
これらはGoogleを含む、様々な検索エンジンにどのようなサイトなのか、多くの情報を提供する要素となります。
しかし、コンテンツを検索エンジンにより適切に理解させるには、コンテンツの関連性をアルゴリズムにアピールする必要があります。
そのため、サイトのメイントピックに対して、関連性のあるコンテンツを幅広く提供する必要が出てきます。
まとめ
コンテンツは、特定の1つの質問に答えるだけでなく、カスタマージャーニー全体をカバーする必要があります。
カスタマージャーニーマップとは、「Customer(顧客)」「Journey(旅)」「Map(地図)」という言葉からも分かるように、カスタマー(ターゲット)が企業やサービスとどのような接点を持ち、顧客となるのかを地図のように書き出したもののことを指します。顧客の旅路と考えると分かりやすいかもしれません。
【テンプレあり】BtoB向け カスタマージャーニーマップの作り方 – BtoBマーケティング支援会社「unname」
ユーザーがページ内のコンテンツを消費すればするほど、SEO対策において有利になります。
ユーザー体験やエンゲージメントが低いコンテンツは、顧客をカスタマージャーニーの次のステップに進んでもらうことができなくなります。
トピック全体を包括的にカバーする魅力的なコンテンツを書けば、サイトでのユーザー体験が向上し、Googleにポジティブな行動シグナルを送信できます。
現在上位表示されているコンテンツをそのままコピーするのではなく、ユーザーに付加価値を与えるような最適なコンテンツ作成を検討してください。
競合サイトに含まれていない、差別化できる単語やフレーズを追加して、検索エンジンにさらなる価値を提供することが、情報利得スコアを向上させる方法になります。
最後にこの記事が参考になった、あるいはご質問などがある方は、ぜひコメント欄でお聞かせください。
コメント