Thứ Năm , Tháng Bảy 20 2017
Home » Kiến Thức SEO » Thẻ canonical là gì? Cách tối ưu thẻ canonical trong SEO

Thẻ canonical là gì? Cách tối ưu thẻ canonical trong SEO

Rel=Canonical là gì?

Đơn giản là thẻ rel=canonical là cách nói với Google rằng một URL tương tự với một URL khác vì mục đích tìm kiếm. Cụ thể là URL (B) là một trùng lặp với URL (A) và thẻ canonical chỉ đến (A). Thẻ sau sẽ xuất hiện trên trang sinh ra URL (B), trong thẻ <head></head>:

<link rel="canonical" href="http://www.example.com/url-a.html" />

Tài liệu hỗ trợ của Google về rel=canonical rất tốt. Chủ đề về nội dung trùng lặp rất phức tạp, và tôi đã chỉ ra trước đó một cách chi tiết. Với bài viết này, tôi sẽ bỏ qua một bên và giả định rằng bạn có hiểu biết về SEO kỹ thuật và cố gắng dùng rel=canonical trên trang web của bạn.

Ghi chú: Thẻ Rel=canonical cũng được nhắc đến như “rel-canonical” và “thẻ canonical”. Với bài viết này, tôi sẽ nhắc đến nó thống nhất là “rel=canonical”.

 (1) Tôi có nên dùng Rel=Canonical cho việc phân trang?

Tôi sẽ không nhắc lại tất cả câu trả lời của Google, nhưng đây là câu hỏi thường gặp đáng được đi vào chi tiết hơn. Thử nghĩ bạn có một loạt kết quả tìm kiếm phân trang (1,2,3 … n). Đó có thể bị coi là “mỏng”, từ một điểm tìm kiếm, vì thế bạn có nên dùng rel=canonical trang n trở lại trang 1?

Câu trả lời chính thức là “không” – Google không khuyến khích việc này. Họ khuyến khích bạn dùng rel=canonical đến trang “View All” hoặc bạn sử dụng rel=prev/next . Rel=canonical có thể sử dụng kết hợp với rel=prev/next để xử lý việc sắp xếp, lọc tìm kiếm, v.v. nhưng nó sẽ dẫn đến phức tạp hoá.

Phân trang với SEO là chủ đề phức tạp, và tôi khuyên bạn nên tham khảo 2 nguồn sau:

(2) Tôi có thể dùng Rel=Canonical Cross-domain?

Có – Cuối năm 2009, Google công bố hỗ trợ ho việc sử dụng cross-domain use of rel=canonical. Điều này đặc biệt dành cho nội dung cung cấp thông tin, khi bạn lo ngại về sự trùng lặp và chỉ muốn 1 phiên bản nội dung được quyền xếp hạng.

(3) Tôi có nên dùng Rel=Canonical cho Cross-Domain?

Câu hỏi này khó hơn. Trước hết, Google có thể chọn bỏ qua việc sử dụng cross-domain của rel=canonical nếu các trang có vẻ quá khác hoặc nó có vẻ lôi cuốn. Việc sử dụng cross-domain rel=canonical lý tưởng sẽ là tình huống khi nhiều site sở hữu bởi cùng một cá thể chia sẻ nội dung, và nội dung đó hữu ích cho người dùng của từng trang web riêng biệt. Trong trường hợp đó, bạn có thể không muốn sử dụng điều hướng 301 (nó có thể làm khó người dùng và tổn hại đến từng thương hiệu riêng), nhưng bạn có thể muốn tránh các vấn đề nội dung trùng lặp và kiểm soát những thuộc tính Google hiển thị trên kết quả tìm kiếm. Tôi không thường sử dụng rel=canonical cross-domain nếu chỉ để củng cố PageRank.

 (4) Tôi có nên dùng Rel=Canonical trên Near Duplicates?

Như thí nghiệm catastrophic canonicalizationcác thí nghiệp theo sau đó cho biết, Google đề cao rel=canonical trên các trang rất khác nhau, trong nhiều trường hợp. Điều đó không có nghĩa là đây là một ý tưởng hay. Nói chung, tôi nghĩ tốt nhất nên dành rel=canonical cho nội dung trùng lặp hoặc gần trùng lặp. Ví dụ, nếu các trang của một sản phẩm tạo thành 5 URL cho 5 màu khác nhau, mỗi trang màu chỉ khác biệt bằng 1-2 câu, hoặc 1 tấm ảnh, và vâng, tôi nghĩ rất ổn để rel=canonical cho trang sản phẩm “mẹ”.

Đừng dùng rel=canonical thay cho 301-redirects và/hoặc 404. Dù nó không gây ra biến động lớn, tôi rất nghi ngờ rằng Google bắt đầu bỏ qua thẻ canonical và điều đó có thể ảnh hưởng đến việc bạn kiểm soát những nội dung trùng lặp hợp pháp.

(5) Tôi có thể đặt Rel=Canonical vào trang canonical?

Nói cách khác, việc đặt thẻ rel=canonical vào bản canonical của URL, rồi trỏ lại chính nó có được hay không? Nói thực là có – nhưng bạn không cần. Đã có những ám thị rằng cả Google và Bing sẽ dễ chịu hơn nếu bạn không lạm dụng rel=canonical. Qua thời gian, lập trường đó có vẻ mềm hơn, tôi không thấy bằng chứng nào trong lịch sử việc sử dụng canonical hợp lý và tự tham chiếu gây ra thiệt hại gì.

Đó thường chỉ là một vấn đề thực tiễn – nhiều URL chia sẻ cùng template, và mã nguồn cần thiết để hiển thị một thẻ rel=canonical trên chỉ các nội dung trùng lặp và không phải bản canonical của một trang có thể gây lộn xộn và tăng nguy cơ mắc sai lầm. Về cá nhân, tôi tin rằng các máy tìm kiếm nhận ra thực tế mà hầu hết các quản trị web đối mặt và điều chỉnh lập trường ban đầu bảo thủ của họ.

(6) Sẽ ổn không nếu đặt Rel=Canonical trên toàn bộ trang web?

Bạn có nên đánh phủ đầu rel=canonical toàn bộ trang web của bạn – ngay cả khi nhiều trang không chủ đích cho vấn đề nội dung trùng lặp? Tôi nghĩ đó có vẻ rất lý thuyết. Chúng tôi đã gợi ý cách làm này tại SEOmoz và tôi nghĩ nói chung là an toàn. Tôi chỉ lo lắng rằng việc sử dụng quá nhiều rel=canonical có thể khiến các máy tìm kiếm hạ giá và thậm chí phớt lờ những thẻ này, nhưng tôi không thể chỉ ra bằng chứng rõ ràng nếu nó xảy ra. Tôi cũng lo rằng người ta thường tiến hành rel=canonical trên toàn trang một cách tồi và kết quả là chỉ chúng đến các trang sai.

Tôi nghĩ rằng một rel=canonical phủ đầu trên trang chủ của bạn là ý tưởng hay, vì các trang chủ hướng đến các URL khác nhau. Một cách hoàn hảo, tôi sẽ nói sử dụng rel=canonical trên trang chủ, các trùng lặp biết đến và bất cứ trang nào với các tham số có thể dẫn đến nội dung trùng lặp, và chừa ra phần còn lại. Tuy nhiên, đó thường là quy trình rất khó. Trong nhiều trường hợp, thực hiện rel=canonical toàn trang sẽ tốt hơn là không kiểm soát index.

(7) Tôi nên dùng Use Rel=Canonical hay 301 Redirects?

Hãy hiểu rằng dù 2 cách làm có vẻ tác động như nhau, đứng trên quan điểm SEO, chúng không thể thay thế cho nhau. Sự khác nhau quan trọng – một điều hướng 301 đưa người dùng đến URL hợp quy, trong khi một rel=canonical không thế. Thường thì chỉ 1 trong những cách này là đúng cho khách truy cập. Nếu bạn thực sự muốn vĩnh viễn nhập 2 trang và loại bỏ trùng lặp, hãy sử dụng điều hướng 301. Nếu bạn muốn giữ cả 2 trang cho người dùng, nhưng chỉ một trang xuất hiện trên kết quả tìm kiếm, hãy sử dụng rel=canonical.

 (8) Rel=Canonical có thể vượt Authority/PageRank?

Rất khó để đo, nhưng nếu bạn dùng rel=canonical hợp lý, và nếu Google ghi nhận, nó sẽ thực hiện tương tự như điều hướng 301. Chúng tôi nghi ngờ nó vượt authority/PageRank cho các liên kết đến URL non-canonical, với một vài mất mát (tương tự như 301)

(9) Tôi có thể chắp nối các Rel=Canonicals (+301s, 302s, etc.)?

Đều gì xảy ra nếu bạn rel=canonical đến một URL với rel=canonical đến một URL khác, hoặc bạn rel=canonical đến một URL mà 301-redirect đến URL khác? Nó sẽ rất phức tạp. Trong nhiều trường hợp, nó có thể hiệu quả và thậm chí có thể vượt PageRank. Nói chung, tuỳ vậy, đó là ý tưởng tồi. Đỡ thì nó chỉ cẩu thả. Tồi nhất là nó không có tác dụng gì, hoặc bạn có thể mất PageRank qua chuỗi mắt xích. Hãy cố gắng tránh những chuỗi mắt xích và thực hiện rel=canonical đơn lẻ.

 (10) Các trang Non-Canonical có được lập chỉ mục?

Với tất cả các mục đích thực tiễn là không. Nếu Google đề cao một thẻ rel=canonical, vì thế trang không canonical không hợp pháp để xếp hạng. Đó không có một bản cache duy nhất, và nó không xuất hiện trên chỉ mục công khai qua một tìm kiếm “site:” . Giờ đây, Google có còn giữ một bản ghi của URL không canonical? Tôi giả định là họ có. Tuy nhiên, nếu là SEO, URL không canonical sẽ biến mất trong bất cứ con đường nào.

(11) Người khác có thể Rel=Canonical trang của tôi?

Tôi đã thấy nhiều người lo lắng về việc người khác sử dụng rel=canonical, đặc biệt qua cross-domain để làm hại một site hoặc ăn cắp uỷ quyền của site đó. Ghi nhớ rằng bạn chỉ có thể được quyền canonical từ các trang bạn kiểm soát. Vì thế, bạn có thể rel=canonical tất cả các trang của bạn tới một site của một ai đó khác, nhưng người ta làm thế để làm gì? Để có thể tàn phá được, ai đó sẽ phải tấn công vào site của bạn. Nếu việc đó xảy ra, lạm dụng rel=canonical sẽ là vấn đề nhỏ nhất của bạn. Những vấn đề lớn hơn bởi rel=canonical là tự nó gây ra.

(12) Tôi có thể có miếng bánh của tôi và vừa có thể ăn nó?

Không. Tôi biết, bạn không muốn nghe. Ít nhất một phần ba các câu hỏi chúng tôi có được về rel=canonical đều quay quanh “tôi muốn tất cả các trang đó xếp hạng, chúng giống nhau, nhưng tôi không muốn gặp rắc rối với nội dung trùng lặp!” Tôi không có gia vị bí mật nào cho món này.

Bạn không phải dùng rel=canonical, nhưng theo kinh nghiệm của tôi, việc kiểm soát nội dung trùng lặp của chính bạn tốt hơn là để Google thay bạn làm việc đó, và cuối cùng nếu họ buộc phải làm cho bạn. Trước kia, đó có thể chỉ nghĩa là một trang sai không được lọc. Tuy nhiên, sau hơn 25 lần cập nhật Panda, việc đó có thể có nghĩa là toàn bộ site chịu ảnh hưởng. Bạn không thể có cả hai – nếu bạn có nội dung trùng lặp, hãy gỡ bỏ, kiểm soát và cải thiện nó.

Thẻ canonical là gì?

Thẻ Canonical là 1 cách để truyền giá trị của 1 trang cho 1 trang khác mà không phải sử dụng Redirect 301. Canonical được sử dụng trong trường hợp một trang web có thể được truy cập bằng nhiều URL khác nhau. Do Google coi mỗi URL là 1 trang độc lập nên nó chỉ Index 1 URL. Những URL còn lại sẽ không được Index và những giá trị của chúng sẽ không được sử dụng để tăng uy tín và thứ hạng trang đích.

Thẻ Canonical Tag là gì?

Với những nội dung có nhiều URL (ví dụ: https://khuongbui.com ~ https://khuongbui.com/dich-vu-seo), thẻ canonical được đặt trong phần <head> của mã HTML để chỉ cho Google và các Search Engine biết URL nào được Index.

Ví dụ:  <link rel=”canonical” href=”https://khuongbui.com” />

Xem thêm: Tác dụng của thẻ meta rel=”canonical”, tác hại khó lường nếu dùng sai

Thẻ Canonical là công cụ giúp bạn chỉ cho Google biết đâu là URL gốc cần Index. Đồng thời truyền toàn bộ giá trị của những URL không được index sang URL gốc, giúp tăng uy tín và thứ hạng của trang được indexed.

Trong thực tế có rất nhiều website gặp phải trường hợp:

  • Khi bạn search Google và click vào trang web –> hiển thị URL1 (indexed)
  • Khi bấm vào menu trên website vào trang web –> hiển thị URL2 (not indexed)
    Nếu không sử dụng Canonical, link từ trang chủ sẽ không giúp tăng thứ hạng của URL1

Ví dụ sử dụng Canonical với trang web nhiều URL:

  • https://khuongbui.com
  • https://khuongbui.com/
  • https://khuongbui.com/index.html
  • https://www.khuongbui.com
  • https://www.khuongbui.com/index.html

Ngoài việc sử dụng thẻ Canonical, bạn có thể sử dụng Redirect:

  • Redirect 301 (chuyển nhà vĩnh viễn): truyền giá trị cho trang đích
  • Redirect 302 (chuyển nhà tạm thời): không truyền giá trị cho trang đích

Sai lầm khi sử dụng Thẻ Canonical

  • Sử dụng sai URL trang gốc dẫn đến không trang nào được index.
  • Dùng URL hiển thị trên thanh địa chỉ của trình duyệt đưa vào Canonical, dẫn đến Google không biết trang nào là gốc, vì ai cũng bảo tôi (URL đang hiển thị) là gốc.

Túm lại, Tổng kết Canonical là gì

Canonical Tag nên được sử dụng…

  • Khi 2 hay nhiều URL có cùng nội dung
  • Giữa các domain khác nhau
  • Để thay cho Redirect trong việc xử lý vấn đề trùng lặp nội dung
  • Để chỉ dẫn nhưng không bắt buộc Search Engine phải theo.

Thẻ Canonical trợ giúp SEO như thế nào?

Chuyên gia Patrick Stox đưa ra khi nào nẻn sử dụng canonical tag, cũng như một số vấn đề phổ biến xảy ra trong quá trình thực hiện.

Trong một thế giới lý tưởng, sẽ chỉ có một phiên bản của mỗi trang. Thế giới quá lộn xộn và cùng một nội dung có thể tồn tại ở nhiều vị trí trên cùng một trang web và các trang web khác. Cách đây nhiều năm, một giải pháp đã được thông qua để giải quyết cho các vấn đề nội dung trùng lặp này: “định dạng thành phần liên kết”, được biết đến như là “rel = canonical” hoặc “canonical tag“.

Thẻ Canonical là gì?

Thuật ngữ Canonical có thể khó hiểu với bạn. Hãy để tôi giải thích điều này bằng những thuật ngữ đơn giản.

Giả sử có hai URL của một trang web:

  • https://khuongbui.com
  • https://www.khuongbui.com

Cả hai trang đó đều hiển thị nội dung và không có trang nào chuyển hướng đến bất kỳ trang nào. Điều này có thể dẫn đến vấn đề trùng lặp nội dung trên Google và bạn có thể bị phạt.

Hãy để chúng tôi xem một ví dụ khác. Có hai URL trên một trang web có cùng độ phân giải trang.

  • https://khuongbui.com
  • https://khuongbui.com/index.php

Nếu cả hai trang web này đều có cùng kết quả, thì điều này cũng có thể gây ra vấn đề!

Bạn có thể không chú ý nhiều đến vấn đề này, nhưng điều này có thể dẫn đến hình phạt nội dung trùng lặp nghiêm trọng. Vấn đề với công cụ tìm kiếm là không thể tự quyết định phiên bản của URL mà công cụ cần phải thêm vào và lập chỉ mục. Nếu hai trang đang giải quyết cùng một nội dung, và Google sẽ giả định rằng một bản sao là bản sao của trang kia và trang web của bạn sẽ bị phạt.

Nếu trang web của bạn có thể mở 2 URL hiển thị cùng một nội dung, thì bạn phải sửa nó. Bạn phải sử dụng cài đặt máy chủ để người dùng mở với www hoặc non www, trang web sẽ hiển thị 1 phiên bản.

Mặc dù, đôi khi bạn muốn chia sẻ cùng một nội dung trên hai URLS, sau đó bạn có thể sử dụng thẻ rel = “canonical” để cho công cụ tìm kiếm biết đó là bản gốc và cái nào là bản sao của nó. Điều này có thể giúp bạn tránh khỏi bị phạt nội dung trùng lặp.

Thẻ Canonical hỗ trợ SEO như thế nào?

Thẻ Canonical chuẩn giúp giải quyết các vấn đề nội dung trùng lặp bằng cách xác nhận 1 URL chính thức duy nhất, mọi bản sao được Canonical xác nhận về URL chính thức đó. Có thể thấy nhiều vấn đề khác nên phải sử dụng thẻ Canonical như:

  • https và http
  • www và non www
  • index và trang mặc định
  • Sử dụng phiên bạn mobile hoặc phiên bản AMP

Để thẻ Canonical ở đâu?

Hầu hết chúng ta đều biết rằng bạn có thể sử dụng một thẻ Canonical trong <head>, chẳng hạn như:

<link rel=”canonical” href=”https://example.com/” />

Bạn có thể biết là một thẻ Canonical có thể được đặt trong tiêu đề HTTP là tốt, chẳng hạn như:

HTTP/1.1 200 OK
Link: <https://example.com/>; rel=”canonical”

Thẻ Canonical không hoạt động

Thẻ canonical không phải là một chỉ thị, nghĩa là nó có thể bị bỏ qua. Phiên bản canonical là phiên bản của trang web nên được sử dụng trong các sơ đồ trang, và việc có các URL xung đột trong sơ đồ trang hay trong các liên kết nội bộ (internal link) của bạn có thể đưa ra các tín hiệu lộn xộn.

Các việc khác có thể sai sót, như là sao chép các trang và không thay đổi thẻ canonical hoặc để lại dòng “thay đổi tôi” hoặc “thay thế tôi” trong canonical. Bạn cũng nên sử dụng URL tuyệt đối – không phải tương đối – trong canonical để giúp tránh các lỗi. Những thẻ này và các thẻ canonical sẽ tự định nghĩa và có thể gây ra việc nhiều trang cùng thể hiện với công cụ tìm kiếm rằng chúng là phiên bản ưu tiên. Nếu trang web có nhiều thẻ canonical khác nhau, thì Google sẽ bỏ qua cả hai.

Google sẽ làm gì nếu có các dấu hiệu lộn xộn như nói ở trên? Họ sẽ cố xác định đường dẫn tốt nhất sử dụng các tín hiệu khác nhau như các thẻ canonical, liên kết nội bộ hoặc sơ đồ đường dẫn, và một số yếu tố khác nữa. Ví dụ như họ có thể cố gắng chọn một đường dẫn ngắn hơn so với một đường dẫn dài hơn hoặc chọn HTTPS thay vì HTTP.

Google ưu tiên các trang HTTPS hơn các trang HTTP tương tự nếu trùng nội dung, trừ khi có các tín hiệu xung đột như sau:

  • Trang HTTPS có chứng chỉ SSL không hợp lệ.
  • Trang HTTPS có chứa phụ thuộc không an toàn.
  • Trang HTTPS bị chặn thu thập.
  • Trang HTTPS chuyển hướng người dùng đến hoặc thông qua trang HTTP.
  • Trang HTTPS có liên kết rel = “canonical” đến trang HTTP.
  • Trang HTTPS chứa một thẻ meta robot noindex.

Tương tác của canonical với các thẻ khác

Một thẻ canonical có thể dễ dàng bị sai vì một điều nhỏ nhặt như là lỗi đánh vần hoặc dấu gạch chéo, đặc biệt trong một bộ như đánh số trang hoặc hreflang. Trong các bộ này, việc có một trang khác nhau được lập chỉ mục chứ không phải trang có trong các thẻ sẽ khiến tập hợp các trang đó sẽ không hợp nhất như chúng nên thế, như là việc thiết lập canonical ở trang 2 của một bộ đường dẫn của trang 1. Các thẻ noindex và canonical cũng nên được sử dụng cùng nhau. Tôi đã thấy các trường hợp khi thẻ canonical dường như đưa thẻ noindex tới phiên bản ưu tiên.

Các ứng dụng khác của thẻ canonical

Bạn có biết các thẻ canonical có thể được sử dụng với các tên miền khác nhau? Đây thực sự là một phương cách được ưa chuộng sử dụng khi kiểm soát nội dung. Bạn cũng nên tránh trùng lặp các phiên bản phụ của trang web của bạn, như là phiên bản mobile hoặc các phiên bản AMP. Theo Google thì sắp tới đây bạn sẽ không cần thay đổi các thẻ canonical của mình cho chỉ mục ưu tiên di động.

Các thẻ canonical không cần thiết trong trường hợp hoàn hảo

Trong khi các thẻ canonical hữu ích cho việc tập trung tín hiệu trong nhiều trang, hãy nhớ rằng trong trường hợp hoàn hảo chỉ có một phiên bản duy nhất. Tập trung các trang web với các phương thức khác như chuyển hướng sẽ tốt hơn trong dài hạn, vì bạn có thể hy vọng rằng mình tới được với một phiên bản duy nhất của một trang web.

Trên đây là kiến thức về Canonical tags, ý nghĩa của canonical ảnh hưởng trong SEO như thế nào và cách bạn sử dụng thẻ này đúng cách mang lại hiệu quả thực sự cao. Nếu website của bạn chưa có thẻ Canonical thì hãy nên thêm thẻ này để hạn chế những vấn đề duplicate giữa các page, các phiên bản với nhau…

 

Thẻ canonical là gì? Cách tối ưu thẻ canonical trong SEO
3.1 (62.86%) 7 votes

About Khương Bùi

Blog Khương Bùi SEO được tạo ra nhằm mục đích Chia Sẽ Kiến Thức SEO, Khương Bùi có 4 năm kinh nghiệm trong SEO và Internet Marketing. Bạn có thể tham khảo thêm các bài viết của mình tại đây và cũng có thể kết nối với mình trên Facebook , Google+ và Twitter

One comment