canonicalタグ
かのにかるたぐ
canonicalタグ(カノニカルタグ)は、ウェブサイトにおいて内容が重複または類似している複数のURLの中から、検索エンジンに対して「このURLが正規(本物)です」と指定するためのHTML要素である。これは主に、重複コンテンツによるSEO評価の分散を防ぎ、クローラーのクロール効率を向上させ、指定された正規URLに評価を集中させるために用いられる。特に、パラメータ付きURL、異なるデバイス向けページ、セッションIDを含むURLなどの場合に重要な役割を果たす。
概要
canonicalタグは、ウェブサイトの健全性を保ち、検索エンジンからの評価を最大化するために不可欠な技術的要素である。ウェブサイトの規模が拡大するにつれて、意図的あるいは偶発的に「内容が酷似しているがURLが異なるページ」が生成されるリスクが高まる。canonicalタグは、このような事態が発生した際に、検索エンジンに対して明確な「正規の代表者」を指定するためのメカニクスである。
このタグが果たす役割は、単なる評価の統合に留まらない。ウェブクローラーは有限のクロールリソース(クロールバジェット)しか持っておらず、重複した内容のページを何度もクロールすることは、本来クロールされるべき重要なページへのクロールを妨げる可能性がある。canonicalタグは、重複ページを効率的に処理することで、このクロールバジェットを最適化する効果も併せ持つ。
具体的な使用例・シーン
canonicalタグが最も頻繁に使用されるのは、URLのバリエーションが存在する場合である。ウェブサイトの設計上、技術的要請、あるいはユーザー操作の結果として、同一コンテンツに複数のアクセス経路が生まれる状況は多岐にわたる。
1. パラメータ付きURLの正規化
ECサイトや大規模データベースサイトでは、ユーザーが検索結果を絞り込むためにURLにパラメータが付加されることが一般的である。
- 基本URL:
https://example.com/products/shoes - フィルタリング後:
https://example.com/products/shoes?color=red - ソート後:
https://example.com/products/shoes?sort=price_asc
これらのパラメータ付きURLが生成するコンテンツは、基本URLと本質的に同一であることが多い。この場合、パラメータ付きURLのすべてに、基本URLを指すcanonicalタグを設置する必要がある。これにより、検索エンジンはすべての評価を基本URLに集約し、パラメータ違いのページを重複コンテンツとして処理することを回避できる。
2. 異なるデバイス向けURL(レスポンシブデザインでない場合)
現在主流となっているレスポンシブウェブデザイン(RWD)を採用しているサイトでは、PCとモバイルでURLが共通であるためcanonicalタグは不要である。しかし、古い設計や特定の制約から、PC用とモバイル用で異なるURLを採用しているサイト(例: PC版 site.com/page、モバイル版 m.site.com/page)も存在する。
この場合、モバイルURLにはPC URLを正規として指定するcanonicalタグを記述し、PC URLには対応するモバイルURLを指す<link rel="alternate" media="only screen and (max-width: 640px)" href="[モバイルURL]"> といった指定を合わせて行うことが推奨される。
3. プロトコルおよびドメインの正規化
同一のコンテンツが以下の異なる形式でアクセス可能な場合も、正規化が必要となる。
- HTTPとHTTPS (
http://とhttps://) - wwwありとなし (
https://www.example.comとhttps://example.com) - 末尾スラッシュの有無 (
https://example.com/page/とhttps://example.com/page)
ウェブサイト全体でHTTPS、wwwなし(またはあり)、末尾スラッシュなし、といった統一された形式を定め、すべてのバリエーションから正規形式へcanonical指定を行うことで、ドメイン全体におけるSEO評価の分散を防ぐ。
4. CMSによる複製ページ
多くのコンテンツ管理システム(CMS)では、記事が公開された後も、アーカイブページ、タグページ、カテゴリページなどで記事の抜粋が自動的に生成される。これらの抜粋ページがオリジナル記事と内容が重複しすぎる場合、アーカイブやタグのページからオリジナル記事のURLにcanonicalタグを設定することで、オリジナルの評価が分散するのを防ぐことができる。
メリットと注意点
canonicalタグの利用は、サイトのSEO体制を強化する上で数多くのメリットをもたらすが、その特性を理解せずに誤用すると、かえって検索順位に悪影響を及ぼす可能性がある。
メリット
1. SEO評価(リンクジュース)の統合
最も重要なメリットは、複数の重複URLに分散する可能性のある検索エンジンの評価(被リンクの評価やオーソリティなど)を、指定した正規URLに集中させられる点である。これにより、正規ページが持つランク付けの可能性が向上し、検索結果での視認性が高まる。
2. クロールバジェットの効率化
検索エンジンは、重複コンテンツのクロールに時間を費やす必要がなくなる。canonicalタグを通じて正規化が示唆されることで、クローラーは正規ページのみを重点的にクロールし、その他の重複ページへのアクセス頻度を下げることが可能となる。結果として、サイトの他の重要なページにクロールリソースを割り当てることができ、サイト全体のインデックス効率が向上する。
3. 検索結果のクリーンアップ
重複コンテンツがインデックスされると、検索結果のユーザーに対して同じ内容のページが複数表示される事態が発生する。これはユーザー体験を損ねるだけでなく、サイトの権威性を薄めることにもつながる。canonicalタグにより、検索結果に表示されるURLを一つに絞り込むことが可能になる。
注意点(誤用によるリスク)
1. 誤ったURLへの正規化
内容が全く異なるページ、またはごくわずかな重複しかないページに対して強引にcanonical指定を行うと、指定された正規ページが、本来持つべきでないコンテンツのシグナルを継承しようとして、検索エンジンに混乱を生じさせる。最悪の場合、指定された正規URLの検索順位が大幅に下落したり、指定元のページがインデックスから削除されたりするリスクがある。
2. 複数のcanonical指定
一つのページ内に複数の異なるcanonicalタグを記述することは技術的な誤りである。検索エンジンは、どちらの指定に従うべきか判断できず、結果的に両方とも無視される可能性が高い。
3. canonicalタグとnoindexの併用(矛盾)
canonicalタグは「このページの内容は重複しているが、評価は正規ページに集めてほしい」という指示であるのに対し、noindexタグは「このページを検索結果に表示しないでほしい」という指示である。両者を同時に使用することは、クローラーに対して矛盾したシグナルを送ることになるため推奨されない。重複コンテンツをインデックスさせたくない場合はcanonicalを使用し、特定の理由でページそのものを表示させたくない場合はnoindexを使用するなど、目的に応じて使い分けるべきである。
4. 自己参照canonicalの推奨
Googleは、すべてのページに、そのページ自身のURLを指す自己参照canonicalタグを設置することを推奨している。これは、たとえ重複コンテンツが存在しない場合でも、パラメータの誤認識やサイト設定の不備などによって偶発的に生じる可能性のあるURLバリエーションのリスクに備える保険的な役割を果たすためである。
関連する概念
canonicalタグの機能は、URLの取り扱いに関するいくつかの他の技術的要素と密接に関連している。これらを正しく使い分けることが、効果的なSEO戦略の鍵となる。
301リダイレクトとの違い
301リダイレクトは、恒久的なURLの移転を意味するサーバー側の指示である。ユーザーや検索エンジンを古いURLから新しいURLへ自動的に転送し、古いURLの評価のほとんどすべてを新しいURLに引き継がせる。
対照的に、canonicalタグは、古いURL自体は存続させ、ユーザーがアクセスできるように保ちながら、SEO評価のみを別のURLに集約させるためのHTML内の「ヒント」である。評価を移転させた後も、元のURLにアクセスが発生し続ける場合に適している。もし古いURLを完全に廃止し、今後は新しいURLのみを使用する場合であれば、301リダイレクトを使用することがより適切である。
noindexタグとの違い
noindexタグは、特定のページを検索エンジンのインデックスから完全に除外するよう指示するメタタグまたはHTTPヘッダーである。このタグが指定されたページは検索結果に表示されなくなる。
canonicalタグは、ページをインデックスから除外するわけではない。あくまで「正規のページ」を指定するだけであり、重複ページとして処理されても、クローラーは内容を把握しようと努める。したがって、ページを存続させつつ評価統合を目的とする場合はcanonicalを、ページの内容を一切検索結果に表示させたくない場合はnoindexを使用する。
hreflang属性との関連
hreflang属性は、異なる言語や地域をターゲットとするウェブサイトが、その地域ごとの代替ページを指定するために用いるHTML要素である。これはコンテンツが重複しているわけではなく、ターゲットとするユーザー層が異なるため、評価を統合するのではなく、地域ごとに適切なページを検索結果に表示させることを目的とする。
多言語サイトにおいて、英語版と日本語版のページが存在する場合、それぞれが自己参照canonicalを持ちつつ、相手の言語バージョンをhreflangで指定するのが一般的な構成となる。canonicalタグとhreflang属性は、それぞれ「重複コンテンツの正規化」と「地域別コンテンツの関連付け」という異なる目的で併用されることが多い。
由来・語源
「Canonical(カノニカル)」という言葉は、英語で「規範的な」「正典の」「正式な」といった意味を持つ形容詞である。特に、宗教や文学の分野では「真に認められた作品」「基準となるべきもの」を指す際に用いられる。ウェブの世界においては、複数の候補がある中で「これが正規のURLである」と基準を示す役割を担うことから、この名前が付けられた。
canonicalタグ(具体的には link rel="canonical" 要素)は、2009年2月に主要な検索エンジンであるGoogle、Microsoft(Bing)、Yahoo!の三社が共同で導入を発表した。これは、ウェブマスターが重複コンテンツ問題に対処するための共通のメカニズムを確立するという、業界全体にとって画期的な出来事であった。それ以前は、重複コンテンツの処理は検索エンジンのアルゴリズムに任されるか、あるいは301リダイレクトなどの永続的なURL変更手段を用いる必要があったが、canonicalタグの登場により、ページを存続させつつ評価のみを正規URLに集約させるという柔軟な対応が可能になったのである。
実装形式は、HTMLの<head>セクション内に記述される<link>要素である。
<link rel="canonical" href="[正規化したいURL]">
この記述が、クローラーに対する「ヒント(Hint)」として機能する。検索エンジンは、この指定を強く考慮するが、必ずしも絶対的な「命令(Directive)」として従うわけではない点に留意が必要である。検索エンジンが指定された正規URLと、それを参照しているページのコンテンツの整合性や、ユーザーエクスペリエンスを総合的に判断した結果、異なるURLを正規ページとして選択する場合もあるためだ。
使用例
(記述募集中)
関連用語
- (なし)