BLOG

ブログ

SEO対策で重複コンテンツは避けるべき!解消方法まで徹底解説2023.09.01

サイト内外に重複するコンテンツがあると、SEOにとってマイナスとなります。

せっかくよいコンテンツを作っても「重複」と判断されてしまうと、サイトの評価にも影響してしまいます。

そこで今回は、SEO対策として重複コンテンツを避ける方法をご紹介します。

また似通っているサイトやページの解消方法まで詳しく解説します。SEO対策をしている方は、ぜひ参考にしてみてください。

もしSEO対策の基本から対策方法まで全て詳しく知りたい場合は「SEO対策とは?検索上位表示を狙う方法まとめ!」の記事でSEO対策の情報をまとめているので参考にしてみてください。

重複コンテンツとは

重複コンテンツとは、ページのタイトルやテキストの内容などが、ほかのコンテンツと同じもしくは似通っている状態をいいます。

近年はページ構成や、共起語を分析するツールも増えています。SEOで上位に表示されている内容に近づけるあまり、ページ内の構成が似通ってしまうこともあるかもしれません。

Googleは重複コンテンツの基準を定めています。自サイト内のページどうし、外部のサイトとの間にかかわらず「似通っている」とみなされる可能性がある点は注意しましょう

また、コンテンツはテキストであれば一字一句同じである必要はありません。基本的なテキストが同じで、語尾だけが変わっているものなどは、非常によく似ているといった点からコンテンツが重複しているとみなされるおそれがあるでしょう。

さらにページ単位ではなくブロック単位である点です。ヘッダーフッターやメインコンテンツなど各ブロック単位でコンテンツを判断されます。

重複コンテンツが与えるSEOへの影響

重複コンテンツが与えるSEOの影響は、大きく4つあります。どれもマイナスの影響になるため、できる限り避けたほうがよいでしょう。

検索順位の下落

1つ目は検索順位の下落です。Googleの検索エンジンのアルゴリズムは検索した疑問に対してさまざまなページを検索結果に表示させます。

私たちユーザーは一般的に、検索結果の1位から順にページを開きます。検索の順位が高いほど当然クリックされる確率が高いです。ユーザーは1位のサイトに知りたい情報がページに記載されていない場合、充分でない場合に2位、3位とページを開くことになるでしょう。

もし検索結果がすべて同じであったり、近しい内容のコンテンツになったりしてしまうと、Googleは検索エンジンとしてユーザーのニーズに応えることはできません。

たとえば1位から3位までの内容が似通っていた場合は、知りたいと思った情報にたどり着かない可能性もあります。結果としてGoogleで検索を諦めて、ほかの検索エンジンに変えてしまうこともあるかもしれません。

そのためGoogleは重複ページを」「ユーザーの利便性につながらない」と判断します。

検索結果の自動フィルタリング

2つ目は、検索結果の自動フィルタリングに引っかかる可能性がある点です。Googleは似通ったコンテンツがある場合、そのうちの1つを正規版として認定するといったアルゴリズムがあります。

つまり、正規版として認定されなかったサイトやページは、検索結果の順位が下がる、そもそも検索結果として表示されないといった可能性があります。

自社のサイトやページが重複コンテンツの一つと判断されている場合は、知らず知らずのうちに検索結果に表示されない「自動フィルタリング」がかかっている可能性もあります。確認する方法は後述します。

被リンクの評価分散

3つ目は、被リンクの評価が分散してしまう可能性がある点です。内容が似通ったページが複数の別のURLで見つかると、評価してほしいページで適切な評価を受けられない可能性があります。

被リンクは本来、ユーザーから支持される1ページだけが有益な情報を提供していると評価されます。Googleのアルゴリズムで評価が分散してしまうと、1つであれば100点の評価を受けられるサイトが、3つの場合、30点・30点・40点のように評価されてしまいます。100点の評価を受ければ検索結果として1位が取れるページも、30点であれば1位は取れません。

せっかく評価があげられるのに、評価が分散されてしまうともったいないですよね。優先したいURLを伝える方法もあるので、対策を講じていきましょう。

ペナルティ対象となる可能性あり

4つ目は、ペナルティ対象になる可能性がある点です。無断でコピーしたコンテンツと判断されるとGoogleのペナルティ対象です。

ペナルティ対象になる場合は、ほかのサイトのコピーをしたサイトなどです。ほかのサイトのコピーしたコンテンツは著作権侵害になる可能性もあります。

また、非常に似ているコンテンツも危険です。少しの修正で転載しているサイトもペナルティ対象になります。

近年のGoogleアルゴリズムはコンテンツの質が重要視されます。SEOで上位のサイトを参考にすることは問題ありませんが、自社のサイトで記事などを作成する場合には、どうやったら自社の独自のコンテンツを作成できるかなどを考えるようにしましょう。

Googleもペナルティ対象のページやサイトを取り締まっていますが、過度でない限りはすぐにペナルティの対象にはなりません。しかし、継続的に行ってしまうとペナルティの対象になることもあります。独自のコンテンツを作成するといった意識を持ち、事前から対策を講じていきましょう。

重複コンテンツに関するGoogleの考え方

Googleは重複コンテンツに関する考え方を発表しています。結論から言うと重複コンテンツはいずれにしても避けるべきです。しかし、意図的でなくても発生する可能性はあります。Googleの考え方を改めて確認し、気を付けるようにしていきましょう。

悪意がなければペナルティを科さない

Googleは悪意がなければ、ペナルティを科さないとしています。悪意とは、Googleの検索エンジンの結果を変えようといった意思の上でページが作成された場合です。

似通ったページが複数あると、検索エンジンスパムとして捉えられてしまう可能性があります。スパムはユーザーの利便性を損ねる行為であるため、悪意があると判断されペナルティの対象になります。

Googleでは自動ペナルティと手動ペナルティの2つがあります。ペナルティには3つの種類があり、軽度のペナルティは検索結果の順位が低下します。重度のペナルティはページやドメインが削除されるだけでなく、検索エンジンそのものに登録ができなくなってしまいます。

25〜30%なら重複していても気にする必要はない

Googleの品質管理チームの責任者であるマット・カッツは、2013年にYouTubeに掲載された動画内で「悪意のあるものでない限り、気にすることはない」と述べています。

実際にWeb上のコンテンツの25%~30%は重複するそうです。つまり、ユーザーに対して有益な情報を提供することを考えたうえで、重複することは当たり前であるといった解釈でしょうか。

いずれにしても重複コンテンツの作成は避ける

マット・カッツはGoogleを代表した人物です。言っていることを鵜呑みにしたく成る気持も分かりますが、いずれにしてもポジティブに働くことは考えにくいです。ユーザーにとって有益な質の高いコンテンツを意識してページやサイトを作成しましょう。

ユーザーの視点で考えてみても、知りたい情報がすぐに見つけられないと不便だと感じるはずです。常にユーザーのニーズを満たすコンテンツを作成するようにしてください。

重複コンテンツかどうかを調べる方法

重複コンテンツかどうか調べる方法をご紹介します。いずれも簡単な方法なので、可能な方は一つ一つ行うと安心でしょう。

検索窓に打ち込んで実際に検索する

1つ目に紹介する最も簡単な方法は、検索窓に打ち込んで検索する方法です。重複していると考えられるページテキストの一部をコピーします。コピーしたテキストを検索窓に打ち込むと一致するページが検索結果に表示されます。

テキスト文字が一字一句合致、似通っているとコピーコンテンツとなっている可能性が高いでしょう。

URLの末尾に「&filter=0」を追加して再検索する

2つ目は、「&filter=0」を検索するURLの末尾に追加する方法です。先述したようにGoogleは自動フィルタで検索順位を下げることや、そもそも検索から除外する対策をしています。

「&filter=0」を検索するURLの末尾に入力しましょう。自動フィルタを無効にして自分のサイトを検索することができます。

デフォルト設定でヒットしないのにもかかわらず、無効にした結果ヒットしたページが出てくる場合は該当のサイトが重複するコンテンツと判断されていると認識できます。

コピペチェックツールを利用する

3つ目はツールを利用する方法です。「sujiko.jp」というサイトは、入力した2つのURLサイトの類似度を判定できるツールです。無料で利用できます。

sujiko.jpではタイトルの類似度や本文の類似度などを確認することが可能です。自社メディアが複数ある場合はもちろん、ほかサイトとのコンテンツの類似度も確認できます。

「Copy Content Detector」というサイトもコピペチェックができるツールです。テキストは無料で4000字まで登録することができます。Web上の文章との一致率が分かります。

さまざまなツールを有効活用し、見つけやすい方法を探すことがおすすめです。半年に一回など定期的確認するようにしましょう。

Google Search Consoleを利用する

Google Search Consolもコンテンツの調査に役立ちます。Google Search Consolを開き、セキュリティと手動による対策から手順による対策をクリックしましょう。エラーが出なければ、重複したコンテンツがないと考えられます。

また、Google Search Consolのカバレッジという画面から調査する方法もあります。詳細の欄に重複がレポートされている場合があります。

レポートをクリックすると該当のURLも確認できるため、重複コンテンツも簡単に見つけることが可能です。

重複コンテンツが見つかった場合の解消方法

ここでは自社のサイトで重複コンテンツが見つかった場合の解消方法を詳しくご紹介します。

301リダイレクトを活用する

301リダイレクトはWebサイトを旧URLから新URLに引き継ぐときに、必要になる転送処理のことをいいます。SEO評価を旧URLから新URLに引き継ぐことができます。

重複コンテンツが見つかった場合、コンテンツを統合して1ページに集約しましょう。集約後は301リダイレクト処理をしないと、SEOの評価が下がります。

また、301リダイレクト設定をしないと、旧サイトが検索エンジンのクローラーの対象になり、大量のエラーページが発生することになります。

さらに旧URLにアクセスしたユーザーを新URLに移行する処理も301リダイレクトの設定で必要です。コンテンツを変更するときの必須処理ということができるでしょう。

canonicalタグを設置する

canonicalタグを設置する方法もあります。canonicalはカノニカルと読み、日本語で「正規の」という意味の英単語です。重複しているコンテンツのページURLを正規化するためのHTMLタグになります。

canonicalタグを使用する場合は、重要なURLに事前にcanonicalタグを設定しておきましょう。canonicalタグを設定することで、重複しているコンテンツであっても正規URLへのリンク評価を引き継げます。

つまり、被リンクなどを多く獲得している場合、検索エンジンの評価の分散を避けることができます。正規URLのみがSEOにおいても評価されるということです。

canonicalタグは、重複しているコンテンツを解消することにも役立ち、SEO対策の面でも効果的だといえるでしょう。

alternateタグを設置する

alternateタグを設置するのも一つの方法です。alternateはオルタネイトと読み、日本語で「代わりの」という意味の英単語です。内容は同じでもスマホとパソコンで見やすいように別々のURLを使用している場合に使用します。

alternateタグを指定することで、検索エンジンで重複しているコンテンツとみなされずに済みます。スマホ用のサイトと、パソコン用のサイトは、URL自体は異なっていても内容は同じになるでしょう。同一のコンテンツとみなされ、SEOにおいてマイナス評価になることを防ぐことができるでしょう。

noindexタグを設置する

noindexタグを設置する方法もあります。noindexは、サイト内のページの質が悪いときに、検索エンジンに対してインデックスさせないように指示するときに使用するタグです。

自社のオウンドメディアが複数ある場合などで重複コンテンツがある場合、正規化したURLのコンテンツよりも、質の低いページが存在することがあります。

コンテンツの低質の低いページにnoindexタグを使用することで、質の低いページのインデッククスを防ぎます。つまり、質の低いページはインデックスされないため、必然的に質の高いページのみがSEOの評価の対象になります。

重複コンテンツ以外にもコピーコンテンツや、エラーページなど質の低いページが発生することはあります。noindexタグで質の低いページが検索エンジンにインデックスされないようにできるため覚えておくと便利です。

定型文の繰り返しを少なくする

定型文の繰り返しを少なくすることで、検索エンジンにも重複コンテンツと判断されにくくなるでしょう。

ページを増やしていると時短の観点などから定型文が多くなりがちです。特に商品を買わせること、問い合わせをしてもらうことが目的のページは、最後は商品紹介や問い合わせフォームの入力を促す定型文で終わることが多くなります。

定型文が多くても、ちょっとした工夫で定型文を減らすことが可能です。たとえば、ページを占める文章をテーマごとに変更する、まとめの部分で各ページの要約を書くなどです。商品などがある場合は、詳細情報のページにリンクするように作成するとより効果的でしょう。

各ページで方法はさまざまだと思うので、可能な限り定型文の繰り返しを少なくする工夫を凝らしてみましょう。

類似するコンテンツを少なくする

類似するコンテンツを少なくする方法もあります。複数のページの内容を1つのページにまとめるといった方法です。1つのページのボリュームを鑑みながら作成する必要があるでしょう。

たとえば「おすすめクッキー5選」というページと「生地によるクッキーの違い」のページを合体させるなどです。

SEOのコンテンツにおいて、文章量は短すぎても長すぎてもいけません。ページ構成を分析できるツールなどで競合サイトの文字数を確認するなどして、文章量を検討しましょう。

ページが長くなりすぎたり、内容がてんでんばらばらになっていたりすると、離脱率が上がってしまう可能性もあります。無料で使用することができる「ラッコキーワード」などを使ってみましょう。

また、ページの内容を変えるとSEOに影響を与えてしまいます。SEOの順位が高いページは残し、低いページを統合するといった考えも必要かもしれません。

コンテンツを非公開または削除する

コンテンツを非公開または削除することは簡単かつ効果があるでしょう。ページをまとめことが難しい場合や、面倒な場合は選択肢の一つです。質の低いページは削除して、質の高いページだけ残せば、CVR(コンバージョン率)などが大幅に下がる心配もいりませんね。

CVRは、Webサイトの目的をどれだけ達成しているか判断する指標です。Webサイトで問い合わせを目的としている場合は、アクセスした人の中で何人が問い合わせしてくれたかで割合を出していきます。

コンテンツは闇雲に削除することはおすすめしません。非公開にして様子を見るといった方法もあります。

トップレベルドメインを使用する

トップレベルドメインを使用する方法もあります。トップドレベルドメインとは、「.com」「.jp」などがあげられます。つまり、Webサイトのドメインのうち、最後のドットにつくものをいいます。

ヤフーニュースを例に紹介すると「https://news.yahoo.co.jp」の「.jp」の部分です。可能であればユーザーにとってなじみ深いトップレベルドメインや、ドメイン名を使用するようにしましょう。なじみ深いドメインであればページを信頼してアクセスしてくれる可能性が高まるでしょう。

空のページを公開しないようにする

ページを作成する段階のテストページや空ページなどは公開しないようにしましょう。

ユーザーにとって利便性の悪いページがあると、SEOにも影響を及ぼす可能性があります。利便性の低いインデックス不要なページは、先述したようにnoindexタグを使用します。headタグ内にnoindexタグを記述しましょう。

コンテンツが盗用されている場合の対処方法

これまでコンテンツが重複していた場合の解消方法をご紹介しました。しかし、自社のサイトのコンテンツが他社や個人ブログのコンテンツに登用されている場合もあるでしょう。ここでは盗用されている場合の対処方法を2つご紹介します。

Googleに削除申請する

コンテンツが登用されている場合の対処方法1つ目は、Googleに削除申請することです。自分のコンテンツが盗用されていた場合はDMCAと略されるデジタルミレニアム著作権法を基に削除申請が可能です。

DMCAはアメリカで施行されている法律ですが、日本の著作物は対象外です。しかし著作権侵害にあたるコンテンツがある場合は、日本のデジタルコンテンツであってもGoogleに申請することができます。

削除申請のやり方を手順に追って説明します。Googleアカウントにログインして「Google著作権侵害による削除」にアクセスします。

フォームに、必要項目を入力します。必須項目は名前、メールアドレス、著作権所有者、国/地域です。任意の項目として会社名があります。会社ではなく個人の場合は、会社名は空欄でも大丈夫です。

盗用されていると考えるコンテンツについて具体的な内容を記述します。著作権対象物を特定できる情報を記載します。また、自社のサイトなどがどういった著作物なのかどうかの説明が必要です。自分のサイトのURLもこの場所に記載します。著作物が許可を受けて掲載されている場所を指定しましょう。

そして盗用されているコンテンツのURLを1行に1つ入力します。2つ以上URLがある場合は2行に分けて記載します。ここには削除してほしいコンテンツのURLを記載しましょう。誤ったURLを記載しないように細心の注意が必要です。

最後に宣誓供述書のチェックと署名をします。宣誓供述書は供述する情報が嘘ではないことを証明することです。

虚偽の申請は処罰の対象になるため、しっかりと著作権違反であることを事前に確認し、申請を行うようにしましょう。

また、チェック項目にあるLumenプロジェクトとは、Googleと別に受けた申請が削除対象になるかどうか確認している可能性がある機関です。

DMCAの申請が受理されると、Lumenサイトで申請した人の名前から申請内容が公開されます。第三者に情報が開示されることは確実なため、情報を開示したくない場合にはGoogleの削除申請を控えたほうが賢明でしょう。

スパムサイトは放置する

コンテンツが登用されている場合の対処方法2つ目は、スパムサイトは放置することです。特に海外からのスクレイピングサイトの被害は放置しましょう。スクレイピングサイトとは、ほかのWebサイトのデータを自分のサイトのコンテンツとして掲載するものです。

厳密には対処方法とは言えないかもしれませんが、スパムサイトは厳格なGoogleのペナルティの対象になります。時間はかかる可能性はありますが、検索結果から除外されるのを待ちましょう。

重複コンテンツについてSEO専門家の見解

重複コンテンツが発生してしまう場合は、基本的にはcanonicalタグを利用することがおすすめですが、重複の種類によってはcanonicalタグを使うべきではない場合があります。

ニュースなどの複数のメディアに同じコンテンツが配信される「コンテンツシンジケーション」においては、canonicalタグではなく、noindexを使用すべきとGoogleが発言しています。

参考:https://nexer.co.jp/seo_report202305/

コンテンツシンジケーションのイメージとしては、プレスリリースを配信した場合、そのプレスリリースは複数のメディアに引用されます。
この際に、複数メディアの引用記事はcanonicalタグではなくnoindexにしてもらうようにしましょう。

まとめ

今回は重複するコンテンツを避けるべき理由を詳しく解説しました。自分のサイトのコンテンツが重複した場合に、重複コンテンツを解消する方法も数多くご紹介したので、自社のサイトやページに適した方法を試してみてください。

いずれにせよコンテンツの重複を避けることで、SEO対策にもなります。もし盗用されているコンテンツがあった場合は、Googleに申請するのも手段です。

Googleのアルゴリズムは日々進化しています。これからもコンテンツの質が最重要視されることでしょう。ぜひサイトを運営している方は、改善してみてください。

NEXERは各社の課題に合わせた
専用SEOプランをご提案いたします!
  • どんな対策をすればいいかわからない…
  • 最適な対策キーワードがわからない
  • 施策実行のリソースが不足している

SEOコンサルタントが貴社サイトの課題を洗い出し、最適なSEO対策を一緒に考えます。

SEO無料相談はこちら

Contact お問い合わせ

私たちNEXERはお客様の課題解決をサポート致します。
ご不明点やご要望がございましたら、お気軽にお問い合わせください。

PAGE TOP