LSIキーワードとは?SEOであまり重要ではない理由
この記事で分かること
- LSIキーワードとは何か
- SEOにおけるLSIキーワードの重要性について
- 意味的に関連するキーワードを正しく使用する方法
LSIキーワードは、2000年代半ばにGoogleの検索アルゴリズムとLSI(Latent Semantic Indexing)技術が結びついたことで、SEOコミュニティで初めて広まりました。
ちなみにLSIは、日本語で潜在意味インデックス、または潜在的意味索引と呼ばれています。
それ以来、LSIキーワードについては、SEOの業界やネット上で定期的に話題に上がるトピックとなっています。
このLSIキーワードは、Googleの検索エンジンで上位表示されるための、魔法のような隠れたキーワードとして言及されている場合もあります。
この記事では、LSIキーワードとは何か、SEOとの関連性、そしてキーワードリサーチ戦略におけるLSIキーワードの使い方について説明します。
LSIキーワードとは?
LSI(Latent Semantic Indexing)キーワードは、主要なキーワードに関連する単語やフレーズとして扱われるようになりました。
例えば、ケーキの作り方について書かれた記事の場合、LSIキーワードとしては
- 小麦粉
- バター
- 生地
- 焼き方
- オーブン
などが挙げられます。
このようにターゲットキーワードと意味的にしっかりと関連付けられたキーワードをページに含めることで、検索エンジンはキーワードの意図やコンテンツの文脈を理解しやすくなります。
そのため、意味的に関連するキーワードを含めることがコンテンツ戦略において重要ということです。
ここで疑問を持つ方もいるかもしれません。
呼び方が違うだけで「LSIキーワード=意味的に関連するキーワード」ではないのか?
これは多くの人が勘違いをしている点で、著者がこの記事を書こうと思ったきっかけでもあります。
まずはLSIについて解説します。
潜在意味インデックス(LSI)とは?
潜在意味インデックス(LSI)は、自然言語処理に使われる情報検索技術の一種で、テキスト全体の意味を理解するために単語や概念の関係性を認識するのに使われています。
LSIは、検索エンジン上に存在する大量のテキスト内に共起する単語を整理・分析し、関連する用語や意味的に繋がりのあるトピックを見つけることができます。
「LSIキーワードを活用することにより、検索順位を高める可能性がある」と多くの人が言及する理由にはこのような背景があるからです。
LSIキーワード肯定派によるLSIのメリットとは、特定の検索結果とユーザーのクエリとの関連性をより適切に判断できることにあると考えています。
この情報から見て取れるように、SEOコミュニティの人々がLSIキーワードに対して非常に関心があることがわかります。
ただし、肝心のGoogleは、LSIキーワードをどのように考えているのか?
LSIキーワードに対するGoogleのスタンス
Googleのジョン・ミューラー(John Mueller)氏は、Twitter上でLSIキーワードについて下記のように言及しています。
こちらはツイートを翻訳したもの。
LSIキーワードというものは存在しない。そうでないと言っている人は勘違いしている。
まずLSIは、1980年代に米国のベル研究所の研究者たちによって考案されました。
当時、彼らはサンプルデータベースとして8つの書籍に対してインデックス付けを行う例を発表し、このプロセスの特許を取得していました。
現在のLSIの特許については下記のサイトで確認できます。
しかし、研究者たちはLSIキーワードという言葉について一切言及しておらず、LSIキーワードの存在を示唆したわけでもありません。
海外の著名なSEO研究者、検索特許の専門家であるビル・スロースキー(Bill Slawski)氏も同じ意見を述べています。
Googleの特許や論文のほとんどを調査した結果、LSIキーワードの効果について記述した論文は見当たりませんでした。セマンティックトピックモデルに関する論文はありますが、これはLSIキーワードとは関係がなく、実際にLSIキーワードの代わりになるかもしれない私の提案の一つにより深く関連しています。
What are LSI Keywords and What I Use Instead of Them? – SEO by the Sea
コンテンツの最適化を行う際に、LSIキーワードの抽出や提案を行うSEOツールが市場にはいくつかあり、LSIキーワードの使用を提案するマーケターも多く存在します。
しかし、LSIキーワードを追加することでどのような効果があるか、具体的な事例や説明を確認できる情報は少ないようです。
Googleの特許には、ページ上のキーワードを特定し、ターゲットキーワードに対して上位表示を行う方法が記載されています。
しかし、その特許内の文章に「LSIキーワード」という用語は一度も登場せず、冒頭のツイートからもわかるように、GoogleはLSIキーワードの存在を否定しているため、LSIキーワードというものは「SEO界隈のバズワードに過ぎない」と捉えて良いと思います。
LSIキーワードはSEOにおいて重要ではない理由
Googleや他の検索エンジンにとって、LSIキーワードが重要でないと考えられる理由はいくつかあります。
LSIは1980年代に考案された技術
潜在意味インデックスは、言語モデルの一種を表していますが、全ての言語理解のアプローチを代表するものではありません。
LSIは、潜在意味解析(LSA)を発明したスーザン・デュメイス(Susan Dumais)氏が1989年に特許を取得した、インターネットが誕生する前の技術です。
上記画像の特許資料によると、スーザン・デュメイス氏が扱うLSIのユースケースは、小さな文書群で不変の情報を扱ったものであり、現在のWebのような広大で流動的な情報に対して有効な検索プロセスではない可能性があることが示されています。
LSIキーワードに対する特許は取得していない
LSIキーワードを「Googleが特許として登録しているキーワード」と解説しているサイトがありますが、GoogleはLSIキーワードに関する特許は取得していません。
これはLSIとLSIキーワードを混同してしまっているのが原因だと思われます。
また、LSIの特許は1989年に取得され、米国で出願された特許は20年間保護されることから、GoogleがLSI技術を検索アルゴリズムに組み込むには、2009年まで待たなければならない計算になります。
これらの背景を考えると、1998年に設立された検索エンジン会社が、特許の保護が解除されるまで11年間待つということは現実的ではありませんよね?
Googleは最新の技術を使用している
Googleは2017年に特許を取得し、検索エンジンがコンテンツを理解するためにWord2Vecベースの技術を使用していることを明らかにしました。
一方、LSIの技術はWorld Wide Webの登場以前に考案されたものであり、現在ではあまり効果的ではないと考えられています。
LSIキーワードがGoogleのガイドラインに沿っていない
LSIキーワードツールを使って、抽出したリストから関連する単語をコンテンツに追加することで、キーワードの乱用が促進されます。
しかし、このような古いブラックハットな方法はペナルティを受け、検索順位が下がる可能性があります。
LSIキーワードと意味的に関連するキーワード
LSIの基本原理は、コンテンツの文脈を理解するために必要不可欠な技術ですが、LSIキーワードと意味的に関連するキーワードは別物と捉える必要があります。
ビル・スロウスキー氏は、LSIキーワードについて次のように述べています。
LSIキーワードは、LSIを使用しておらず、キーワードではありません。
ビル・スロウスキー氏のTwitterから引用
LSIは、コンテンツを最適化するための魔法のテクニックではなく、関連検索からコンテンツを理解する現代の検索エンジン技術の基盤として認識されています。
私たちは検索エンジンのアルゴリズムで、検索意図と関連性を満たすことが重要だと理解しており、関連性が高いキーワードやバリエーションを使用することで、検索エンジンが論理的な関係を理解し、ページの文脈や意味をより正確に把握することができます。
このことから分かるとおり、LSIキーワードではなく、コンテンツに対して意味的に関連するキーワードを使用することが大事だということです。
これはGoogleがフレーズベースのインデックス特許に基づいて、長い時間を掛けて研究をしているのが理由になります。
またGoogleのコンテキストベクター特許は、複数の意味を持つ検索クエリに対して、検索意図を正確に理解するための使用を示唆しています。
例えば「広島」は、日本の都市、野球チーム、お好み焼きなどの意味を持っています。
関連語として
- 野球
- チケット
- 監督
- スタジアム
- マスコット
などをページに含めることで、検索エンジンはあなたのコンテンツが野球チームの「広島東洋カープ」に関するものであることをより正確に理解することができます。
Googleは、自然言語処理を利用して検索クエリの意味を理解することに積極的な姿勢を示しています。
再びビル・スロウスキー氏からの引用です。
Googleは同義語や意味論を好みますが、潜在意味インデックス(Latent Semantic Indexing)とは呼びません。
SEO業界がこれらの用語を使用することは、Latent Semantic Indexingを調べて全く異なる情報(LSIキーワードについて)を見るクライアントにとって、誤解や混乱を招く可能性があります。
LSIキーワードに関するWikipediaの情報はありません。LSIキーワードがどのようにLSIを使用するかについての情報はありません。
LSIキーワードがどのように機能するかを説明する特許は存在しない(特許を取得したことがないため)。
Does Google Use Latent Semantic Indexing (LSI)? – SEO by the Sea
LSIキーワードを見つけるよりも、意味的に関連する検索キーワードをページ内で自然にカバーするようなコンテンツを書くことに注力すべきです。
意味的に関連するキーワードを正しく活用する方法
意味的に関連するキーワードを見つける方法はいくつかありますが、最も効果的なのはGoogleが提供する情報を分析する方法です。
これにより、LSIキーワードの代わりに使用できるキーワードを見つけることができます。
ここからは、メインキーワードに意味的に関連するキーワードを見つけるのに役立つ方法をいくつか紹介していきます。
上位表示されているページを分析する
Googleが何を重要視しているかを示す最も強いヒントは、検索結果にあります。
関連する検索結果の上位ページを分析することで、繰り返し使用されるキーワードや関連するフレーズのパターンを特定することができます。
そして、これらのキーワードをコンテンツに使用することで、Googleがあなたのページをより効果的に理解することができるようになります。
またまたビル・スロウスキー氏からの引用です。
私は特定のページを上位にランク付けしたいクエリ用語を探します。通常、Googleの上位10位にランク付けされているページを見て、私がランク付けを目指しているクエリ用語の意味に一致するものを見つけます。それらのページに表示される完全なフレーズを見つけ、何度も共起するものを探します。それらのフレーズの使われ方を見て、自分のページに含めるためにページを書き直します。例えば、野球場に関するページであれば、「投手のマウンド」「売店」「外野」「ブルペン」「プレー場」といったフレーズがよく現れることがあるかもしれません。
What are LSI Keywords and What I Use Instead of Them? – SEO by the Sea
手動で行う場合、時間が掛かる大変な作業ですが、これは最も効果的なアプローチです。
関連キーワードを分析する
Googleでページのメインキーワードで検索を行い、検索結果の下部までスクロールします。
例えば、「自動車保険」で検索した場合
「google pixel」で検索した場合は下記のように表示されます。
検索結果下部に表示される関連キーワードのセクションは、トピックに対して意味的に関連するキーワードを発掘するのに役立つ場合があります。
注意点としては、表示されているキーワードを片っ端からページに含めるのではなく、メイントピックに対してしっかり意味的に関連性があるかどうかを確認しましょう。
他の人はこちらも質問を分析する
「他の人はこちらも質問」とは、GoogleのSERP機能の1つで、ユーザーが最初に検索したクエリに関連する追加の質問とそれに対する回答を提供するものです。
他の人はこちらも質問では、関連キーワードのセクションと同じように意味的に関連するキーワードやフレーズを見つけることができます。
また、質問箇所をクリックすると抜粋された回答分が表示されるので、その内容も確認すると良いでしょう。
繰り返しにはなりますが、こちらに表示されているキーワードやフレーズも意味的に関連性があるかどうかを必ず確認してください。
【非推奨】サジェストキーワード
Googleのオートコンプリート機能で表示される「サジェストキーワード」から意味的に関連するキーワードを探すのを推奨している人もいますが、あまりおすすめしません。
サジェストで表示されるキーワードは、検索者の検索履歴、または検索者が入力を開始した文字に基づく予測も含めて表示します。
これらは検索エンジンのアルゴリズムを使用して生成されたものではなく、検索者が入力し始めた内容と必ずしも意味的に関連しているわけではないからです。
また、上記で説明してきた方法でキーワードを分析していると、サジェストキーワードで得られるであろう情報を自然と収集できているかと思います。
まとめ
「LSIキーワード」という言葉は、Googleや一部のSEO関係者からは、SEO業界で流行っている言葉にすぎないと公に否定されています。
また、「関連キーワード」や「他の人はこちらも質問」に表示されるワードをLSIキーワードと解説しているサイトもありますが、それはLSIキーワードではありません。
便宜上、これらのキーワードやフレーズを一括りにして、そう呼んでいるだけだと思われます。もしくは本当に勘違いをしているか。
そのため、時間をかけてLSIキーワードを見つけようとするよりも、自身のコンテンツトピックと意味的に関連するキーワードをしっかり特定して使用するほうが得策でしょう。
ページ内にLSIキーワードを強制的に詰め込む必要はなく、適切なキーワード調査を基に自然なスタイルでコンテンツを提供することが重要です。
最後にこの記事が参考になった、あるいはご質問などがある方は、ぜひコメント欄でお聞かせください。
コメント