Canonical URL là một công cụ mạnh mẽ có khả năng chống lại các vấn đề có nội dung trùng lặp và khi có nhiều biến thể của cùng một trang. Bài viết dưới đây giúp bạn biết thêm thông tin canonical url là gì? và khi nào nên sử dụng thẻ rel=”canonical”.
Khái niệm Canonical URL là gì?
Canonical URL hay thường được gọi là phần tử link rel=”canonical”. Nó là một phần tử HTML có khả năng giúp ngăn nội dung trùng lặp bằng cách thông báo cho các công cụ tìm kiếm khi có một tài liệu giống hệt hoặc tương tự khác trên các trang web.
Giả sử khi trang A có phần tử canonical link tham chiếu đến trang B, thì được hiểu rằng trang A đã được canonical URL.
Canonical là quá trình lựa chọn, trong đó một phiên bản ưa thích của một trang được canonical nhiều hơn các phiên bản khác.
Tầm quan trọng của Canonical URL đối với SEO
Đối với canonical URL, có thể giúp trang web của bạn ngăn nhữung nội dung trùng lặp, cả bên trong và bên ngoài website. Nội dung trùng lặp nội bộ xảy ra ngay trong trang web của bạn. Còn nội dung trùng lặp ở phía bên ngoài thường xảy ra khi các trang trùng lặp hoặc tương tự nhau trên các miền khác nhau tồn tại.
Canonical URL có khả năng thông báo với Google, Bing và Yahoo. Từ đó cho ra kết quả những trang nào sẽ được hiển thị và trang nào cần ẩn trong SEPR. Tuy các công cụ tìm kiếm có thể tự ý chọn việc bỏ qua canonical link, nhưng nó cho phép chủ trang web sửo hữu nhiều quyền kiểm soát hơn đối với sự hiện diện trực tuyến.
Ngoài ra canonical url còn có một số lợi ích nổi bật như sau:
- Chỉ định URL khi bạn muốn mọi người nhìn thấy trang web của bạn. Khi đã nhìn thấy được trang web củ bạn, thì có thể mọi người truy cập vào để xem sản phẩm trên đó.
- Canonical URL giúp hợp nhất tín hiệu liên kết cho các trang tương tự hoặc trùng lặp. Điều này một phần có thể giúp công cụ tìm kiếm hợp nhất các thông tin có được cho từng URL riêng lẻ trở thành một URL duy nhất được ưa thích. Điều này nghĩa là dẫn liên kết từ các trang web khác đến.
- Khả năng đơn giản hóa việc kiểm tra chỉ số cho một sản phẩm/chủ đề. Khi trang web của bạn có nhiều URL khác nhau, thì việc hợp nhất chỉ số cho một nội dung cụ thể sẽ trở nên khó khăn hơn. Vì vậy cần có caninocal url để đơn giản hóa mọi việc.
- Giúp quản lý các nội dung được phân phối. Nếu bạn muốn phân phối nội dung để xuất bản trên các miền khác, để muốn hợp nhất vị trí xếp hạng trang cho URL ưa thích của bạn.
- Tránh mất thời gian cho việc thu thập dữ liệu từ các trang trùng lặp. Khi muốn Googlebot khai thác tối đa nội dung trên trang web của mình, vậy thì Googlebot nên dành thời gian thực hiện việc thu thập dữ liệu các trang mới (hoặc cập nhật) trên trang web thay vì chỉ thu thập dữ liệu có nội dung trùng lặp từ các phiên bản dành cho máy tính để bàn và thiết bị di động của cùng một trang.
Việc tối ưu hóa Cnonical URL được thực hiện như thế nào?
Hiểu được bản chất của thẻ Canonical url là gì, vậy cách thực hiện việc tối ưu hóa các canonical URL đạt hiệu quả nhất. Mời bạn cùng tham khảo thêm những chia sẻ dưới đây!
Tại sao cần tối ưu hóa các canonical URL?
Thông thường công việc tối ưu hóa canonical URL gồm những việc xác định nội dung trùng lặp trên website và tìm hiểu nguyên nhân tại sao có sự trùng lặp này. Thông qua một số thủ thuật nhất định để biết được điều này.
Cùng tham khảo ví dụ dưới đây:
Bạn có thể tự kiểm tra nội dung trên trang web của mình từ các trang được gợi ý, vì các công cụ tìm kiếm thường sẽ hiển thị kết quả bằng cách kiểm tra các nội dung của truy vấn đó.
Ngoài ra, hãy sử dụng một số thủ thật tìm kiếm nhỏ của Google hoặc Bing để kiểm tra xem các trang được lập chỉ mục có nhiều hơn số lượng các bài báo hoặc trang đã xuất bản trên trang web của bạn hay không. Sau đó, hãy xem xét các danh mục trên website của bạn (nếu có) và phải đảm bảo rằng không tìm thấy bài viết nào được đăng trong hai danh mục cùng một lúc.
Cuối cùng, hãy kiểm tra các chuyển hướng có trong trang web của bạn để đảm bảo rằng tất cả đều được đặt cấu hình đúng. Khi bạn đã làm xong những bước kiểm tra ở trên, thì bây giờ đã đảm bảo rằng URL chính thức của mỗi trang là tối ưu.
Khi muốn tối ưu hóa một URL chuẩn, thì bạn phải đảm bảo rằng sẽ tuân theo các quy tắc cơ bản cần có để chi phối URL nói chung. Tuy nhiên khi thực hiện tối ưu háo thì cũng nên nhớ phải cung cấp URL ưa thích, để liên kết đến trang web nhất định, tất cả những điều bạn thực hiện đều được các công cụ tìm kiếm nhìn thấy.
Chẳng hạn như bao gồm một từ khóa cụ thể lựa chọn để SEO. Mặc dù nguyên tắc này rất nhỏ có vẻ không đáng kể, nhưng nó lại đóng một vai trò quan trọng trong quá trình SEO. Vì ở cấp độ thuật toán của Google, sẽ thật hợp lý khi một địa chỉ chứa từ khóa để lập chỉ mục trang.
Vậy khi chèn từ khóa, bạn cần lưu ý không nên chèn dấu hoặc ký tự mà công cụ tìm kiếm khó nhận biết.
Việc thêm một cụm từ vào canonical URL là việc chưa phù hợp để nó được tối ưu hóa và không phải là một giải pháp toàn diện để thực hiện. Cũng nên tránh trường hợp đặt URL quá dài, điều này dễ bị lợi dụng bởi mạng xã hội và diễn đàn. Vậy nên, sử dụng cấu trúc dữ liệu cây là một trong những yếu tố gây ảnh hưởng đến độ dài của URL.
Nếu hai trang trên site của bạn có cùng một tiêu đề chính trùng nhau và URL của chúng cũng sẽ giống nhau, thì qua sự hiện diện của cấu trúc dữ liệu cây trong địa chỉ có thể giúp bạn phân biệt chúng. Nhưng bạn không cần tốn thời gian xem qua toàn bộ chuỗi danh mục, chẳng hạn như tồn tại chỉ một hoặc hai yếu tố phân biệt hai trang là đủ.
Thường xuyên quan sát đến việc tối ưu hóa canonical URL của một trang trên site của bạn, hãy đảm bảo rằng chúng bao gồm cả dấu phân tách từ, nhưng các dấu phân tách này phải đặt đúng chỗ để cho các công cụ tìm kiếm dễ dàng hiểu được.
Theo như ta thấy, dấu gạch ngang (-) được chọn làm dấu phân tách đơn giản và phổ biến nhất. Nên tránh dùng các dấu hiệu như dấu phẩy hoặc dấu chấm phẩy làm dấu phân tách, ngoài ra dấu và (&) hoặc dấu thăng (#) nên được dùng để xác định các khu vực riêng của trang web động.
8 phương pháp thực hiện tối ưu hóa Canonical URL
Sau khi bạn đã lựa chọn được canonical URL phù hợp cho một nội dung nhất định trên trang web của mình, thì bây giờ bạn cần thiết lập nó bằng các phương pháp hiệu quả nhất.
Phương pháp 1: Chèn thẻ canonical URL phù hợp vào mã HTML
Khi bạn sử dụng phương pháp này, cần thực hiện các việc như đặt thẻ, với thuộc tính thích hợp, ở thẻ <head>. Thẻ này phải được thêm vào tất cả các trang có nội dung trùng nhau; do đó, tất cả chúng sẽ tham chiếu đến trang có các liên kết với canonical URL. Để thực hiện việc này, giữa “head” và “/ head”, bạn nên chèn thêm mã:
<link rel = “canonical” href = “canonical URL” />
Phương pháp 2: Sử dụng tiêu đề HTTP rel=canonical
Với phương pháp này từ tháng 6 năm 2021, thì bạn có thể định cấu hình máy chủ bằng cách thêm một dòng ở phần tiêu đề HTTP rel= “canonical” để biểu thị canonical URL cho các tài liệu không phải thuộc dạng HTML.
Giả sử như với file PDF bạn nên chèn như sau:
<http://www.example.com/dowloads/document.pdf>; rel=“canonaical”
“canonical”<URL> format, an <URL>expression that is to be inserted at the header level<URL>.
Phương pháp 3: Giải pháp hiệu quả của sơ đồ trang web
Sơ đồ trang web thường sẽ chứa các canonical URL của tất cả các trang trên trang web của bạn. Thông qua đó tất cả các URL trong sơ đồ trang web đều sẽ được đề xuất là canonical URL. Dựa trên mức độ trùng lặp hay tương đương tự về phần nội dung là Googlebot sẽ kiểm tra và quyết định đâu là trang trùng lặp.
Bạn không nhất thiết phải sử dụng bất kỳ các phương pháp nào trong số này để xác định ra canonical URL cho các trang trùng lặp của mình. Nếu làm như vậy, sẽ giúp bạn đảm bảo việc kiểm soát được và lựa chọn thẻ URL thích hợp để liên kết đến một trang có nội dung nhất định trên trang web của bạn. Trong trường hợp, nếu như bạn không xác định rõ canonical URL thì Google sẽ tự động tùy chọn URL phù hợp nhất theo tiêu chuẩn của nó dành cho trang web của bạn. Tuy nhiên những tiêu chí đó chưa chắc sẽ đúng ý bạn.
Phương pháp 4: Sử dụng URL tuyệt đối
Bạn chỉ nên sử dụng URL tuyệt đối để làm canonical URL. Ví dụ điển hình như:
<link> canonical“href=”https://www.example.com/dich-vu/sua-chua/”>
Với URL tuyệt đối này chính là canonical URL, không có bất kỳ vấn đề gì về vị trí chính xác của URL.
Bây giờ, bạn có thể nhìn URL bên dưới và so sánh canonical URL ở trên sẽ thấy URL bên dưới không rõ ràng.
<link rel> “canonical” href= “sua-chua/”>
Rất có thể một số máy chủ web được định cấu hình không chính xác, làm cho mỗi trang trên website của bạn có thể truy cập được nhờ vào tất cả các miền chính và miền phụ. Điều này dễ dàng gây ra một lượng lớn nội dung bị trùng lặp mà bạn nên tránh mọi lúc.
Việc có các URL tuyệt đối làm link rel canonical có nhiệm vụ ngăn chặn các vấn đề nội dung trùng lặp này xảy ra.
Phương pháp 5: Một canonical URL trên mỗi trang
Bạn chỉ nên sử dụng duy nhất một canonical URL trên mỗi trang. Nếu có nhiều hơn một canonical link được xác định, thì các công cụ tìm kiếm dễ bị nhầm lẫn. Google đã tuyên bố rằng họ sẽ chỉ chọn một trong các URL chính xác trên một trang web và dễ dàng bỏ qua những URL khác khi họ gặp nhiều canonical URL trên một trang. Mặc dù chúng tôi không chắc công cụ Bing và cốc cốc có thể xử lý nhiều canonical URL trên mỗi trang như thế nào, nhưng tốt nhất bạn nên sử dụng duy nhất một canonical URL trên mỗi trang cho an toàn
Phương pháp 6: Vị trí trong <head>-section
Thẻ canonical URL phải luôn được đặt trong <head>-section của trang web. Nếu canonical link không được đặt trong <head>-section, thì các công cụ tìm kiếm sẽ không thể tìm thấy nó và xử lý các vấn đề của nó. Đổi lại, điều này có thể dẫn đến tình trạng nội dung trùng lặp hàng đầu.
Phương pháp 7: Tham khảo một trang có thể index
Thẻ canonical URL phải luôn tham chiếu đến một trang có thể được index. Các công cụ tìm kiếm có thể dễ bị nhầm lẫn khi link rel canonical tham chiếu đến một trang được redirect chuyển đổi 301 hoặc chính nó được canonical.
Phương pháp 8: Chỉ có phiên bản ưu tiên trong sitemap XML
Thông thường tất cả các trang có trong sitemap XML của bạn phải được index bởi các công cụ tìm kiếm như Google. Do đó, điều quan trọng là trong những trường hợp bạn có nhiều phiên bản của một trang web thì chỉ đưa phiên bản ưa thích của một trang vào trong sitemap XML của mình.
Sự khác nhau giữa điều hướng 301 và thẻ Canonical URL
- Đối với Canonical Url sẽ không chuyển hướng người dùng sang 1 trang khác mà nó chỉ có chức năng giúp thông báo ngầm đến cho SE biết trong số những trang bị trùng lặp thì url của trang nào là chuẩn nhất. Nhưng trên thực tế, khi sử dụng Canonical Url, thì người dùng thấy cả những trang chưa hề bị chuyển hướng đi. Vì vậy, người dùng thường không nhận biết được về Canonical Url nào là chất lượng trừ khi xem code.
- Còn ở điều hướng 301 thì tự động chuyển hướng người sử dụng từ một trang web này sang 1 trang web khác (có Url khác) đồng thời nó giúp thông báo cho những công cụ tìm kiếm rằng Url trang này không còn ở đây nữa mà đã được chuyển sang 1 Url mới và yêu cầu công cụ tìm kiếm dừng chỉ lập mục Url cũ đồng thời chuyển đến Url mới.
Khi nào cần sử dụng công cụ Canonical URL?
Không có tình huống nào tương tự như việc sử dụng công cụ canonical url. Các công cụ Google, Bing và Yahoo chủ yếu dựa vào link canonical để tìm hiểu một số trang nào sẽ được hiển thị và trang nào bị ẩn trong các trang kết quả của công cụ tìm kiếm. canonical URL có thể tự tham chiếu chính nó hoặc tham chiếu đến một trang web khác.
Canonical URL tự tham chiếu
Nếu bạn chỉ có một phiên bản duy nhất của trang web, hãy đảm bảo rằng link canonical url là tự tham chiếu. Điều này đối với các công cụ tìm kiếm là phiên bản duy nhất của trang web này và chỉ có nó mới được index.
Canonical URL tham chiếu đến một trang web khác
Nếu bạn sở hữu nhiều phiên bản của một trang web, hãy đảm bảo rằng canonical URL đang tham chiếu đến các trang bạn muốn và được index bởi các công cụ tìm kiếm.
Canonical URL khắc phục sự cố nội dung trùng lặp trong một số trường hợp phổ biến như là:
- Khi bạn tham số truy vấn thì được sử dụng trong URL.
- Khi các trang có nội dung hơi khác nhau, thường được gọi là nội dung gần trùng lặp.
- Khi bạn cố ý tạo ra nhiều phiên bản của một trang web.
Tham số truy vấn chứa trong cấu trúc URL
Tùy thuộc vào từng cấu trúc URL khác nhau của một trang web, các URL đôi khi có chứa các tham số truy vấn. Tham số truy vấn trong URL được sử dụng chủ yếu là để yêu cầu nội dung nhất định từ website.
Tham khảo ví dụ sau đây:
www.example.com/giay/adidas?lang=vn&id=208
- Biến lang=vn dùng để chỉ ra rằng các ngôn ngữ dùng cho trang được yêu cầu là tiếng Việt (Vietnamese).
- Biến id=208 dùng để chỉ ra rằng số trang 208 nên được yêu cầu.
- Thông thường Ở giữa các biến có một ký tự & cho biết rằng bạn muốn bạn muốn phiên bản tiếng Việt (Vietnamese) của trang 208.
Mặc dù các tham số truy vấn rất tiện dụng nên được sử dụng nhiều, tuy nhiên các URL có chứa tham số truy vấn thường rất khó đọc và dễ tạo nội dung trùng lặp trên URL. www.example.com/giay/adidas?id=208&lang=vn yêu cầu trang cso nội dung giống hệt như www.example.com/giay/adidas?lang=vn&id=208, nhưng các trang lại có URL khác. Có thể dễ dàng sửa dạng nội dung trùng lặp này bằng một sử dụng công cụ canonical URL.
Các trang tương đương nhau (gần như trùng lặp)
Khi các trang có nội dung chỉ khác nhau một chút, thường được gọi là các trang gần trùng lặp hoặc. Một ví dụ dễ thấy nhất là các trang trùng lặp thường là các trang web thương mại điện tử như bán giày. Hãy tưởng tượng bạn đang có một đôi giày Nike Air Max size 38 với các khác nha như màu đỏ, xanh và đen. Khi bạn muốn chọn một màu khác, URL sẽ có sự thay đổi, nhưng 99% nội dung trang vẫn giữ nguyên chỉ thay đổi về kích cỡ và màu sắc của giày.
- Giày Nike Air Max size 38: www.example.com/giay/adidas/nam-41/
- Tổng quát đôi Nike Air Max size 38 màu đỏ: www.example.com/giaynam/adidas/nam-41-mau-do/
- Tổng thể đôi Nike Air Max size 38 màu xanh lam: www.example.com/giaynam/adidas/nam-41-mau-xanh/
- Tổng quát đôi Nike Air Max size 38 màu đen: www.example.com/giaynam/adidas/nam-41-mau-den/
Quan sát nội dung trên có bốn trang là rất giống nhau thì có thể thực hiện một canonical URL
- www.example.com/giaynam/adidas/nam-41-mau-do/
- www.example.com/giaynam/adidas/nam-41-mau-xanh/
- www.example.com/giaynam/adidas/nam-41-mau-den/
và trỏ đến www.example.com/giay/adidas/nam-41/
Cố ý tạo ra nhiều phiên bản của một trang
Có thể có nhiều lý do để nói về việc bạn cố tình tạo nhiều phiên bản của một trang. Dưới đây là 2 lý do giải thích cho việc làm đó
- Bạn muốn trang đích của mình được cá nhân hóa cho các chiến dịch
- Nhanh chóng chạy các bài kiểm tra tối ưu hóa tỷ lệ chuyển đổi, trong đó bạn kiểm tra nhiều phiên bản của cùng một trang và có cùng nội dung như nhau.
Khi bạn sở hữu nhiều phiên bản của một trang, hãy đảm bảo rằng bạn sẽ trỏ canonical link đến phiên bản ưa thích mà bạn muốn index. Khi một canonical URL tham chiếu đến một URL khác, điều này sẽ giúp thông báo cho các công cụ tìm kiếm biết có nhiều phiên bản trang giống hệt nhau trang củ bạn hoặc có nội dung tương tự.
Tách biệt trang máy tính để bàn và trang di động
Nếu bạn sở hữu các trang dành cho máy tính để bàn và dùng cho cả thiết bị di động riêng biệt. Bạn nên sử dụng công cụ canonical URL và URL thay thế để thông báo về mối quan hệ giữa các trang này với công cụ tìm kiếm.
Hiện tại, thì chỉ có Google là công cụ tìm kiếm duy nhất hỗ trợ triển khai thực hiện việc này.
Máy tính để bàn
Thông thường trên phiên bản dành cho máy tính để bàn của trang web, canonical URL và URL thay thế trong <head>-section dưới dạng như sau:
<head>
<link rel=>”canonical” href=”https://www.example.com/”
<link rel=>”alternate” href=”https://m.example.com/”
</head>
Thiết bị di động
Đối với phiên bản dành cho thiết bị di động của trang web, thì link canonical trong <head>-section dưới dạng sau:
<link rel=”canonical” href=”https://www.example.com/” />
</head>
Thông qua cách này, các công cụ tìm kiếm hiển thị phiên bản như sau:
- Mobile của trang web dành riêng cho thiết bị di động
- Máy tính để bàn của trang web chỉ dành cho thiết bị PC..
Trang chuẩn phổ biến trên nhiều miền
Canonical URL được sử dụng với mục đích là ngăn nội dung trùng lặp trong trường hợp vấn đề nội dung trùng lặp vượt ra khỏi một website. Khi nội dung được xuất bản trên một số trang web hay trên một số miền thì canonical link của nhiều miền có nhiệm vụ báo hiệu cho các công cụ tìm kiếm phiên bản nào của trang cần được index.
Hợp nhất các trang không phù hợp với redirect
Khi cảm thấy không cần thiết để nhiều phiên bản của một trang tồn tại cùng một lúc, tốt nhất bạn nên chuyển hướng các trang thừa phiên bản sang một phiên bản ưu tiên. Ví dụ redirect là một trong những cách tốt hơn nhiều để xử lý nhiều phiên bản trang như sau:
- Một trang web đã có sẵn thông qua các giao thức HTTP và HTTPS.
- Một trang web đã có sẵn thông qua nhiều tên miền chính ( www.example1.com, www.example2.com, www.example3.com). Hoặc một số tên miền phụ ( www.example.com, www2.example.com, www3.example.com) và điều này không phục vụ một mục đích nào của website.
Lưu ý bạn cần nhớ, nếu bạn đang sử dụng trang đổi hướng giống như trong các ví dụ ở trên thì bạn nên chọn sử dụng URL chuẩn hoá. Nếu quá trình chuyển hướng của bạn ngừng hoạt động, bạn vẫn còn có canonical URL của mình để kịp thời ngăn chặn các vấn đề index.
Cách sử dụng thẻ canonical đạt hiểu quả cao
Nhập cú pháp viết thẻ Canonical: <linl rel=”canonical” href=”URL trên chính địa chỉ website của bạn”>
Đối với người làm trong lĩnh vực SEO thì thẻ canonical url có nhiệm vụ thông báo cho Google biết bài viết trên website của bạn không phải là bài viết trùng lặp và nó nên được tìm thấy trong kết quả tìm kiếm website.
Thẻ canonical url phải được chèn trong đoạn đầu của URL và khi bạn sử dụng bạn nên xem xét thẻ này đã xuất hiện nhiều trong website của bạn sẽ gây ra vấn đề không tốt cho website vì điều đó có thể bị Google đánh giá thấp.
Nhưng trong trường hợp không cần bạn phải xử lý nội dung sao với các bài viết giống nhau thì bạn hãy sử dụng thẻ này để chắc chắn rằng bạn không bị Google phạt do mắc lỗi trùng lặp nội dung trên trang web.
7 Sai lầm thường mắc phải khi sử dụng Canonical URL
Theo như tìm hiểu thì Canonicalization vốn là một chủ đề hơi phức tạp, nó thường xuyên phải nằm trong TOP những lỗi kỹ thuật SEO thường mắc phải nhất trong những năm qua.
Nhưng trên thực tế, cũng có rất nhiều hiểu lầm và các quan niệm sai lệch trong việc sử dụng Canonical URL đúng cách. Dưới đây là 7 sai lầm phổ biến mọi người thường hay mắc phải khi sử dụng thẻ canonical url:
Chặn URL đã được chuẩn hóa thông qua Robots.txt
Khi bạn tự ý chặn một URL trong robots.txt là việc làm sẽ ngăn không cho Google thu thập dữ liệu. Có nghĩa là công cụ tìm kiếm sẽ không thể thấy bất kỳ Canonical Tag nào trên đó. Kết quả là Google cũng không có cách nàp giúp chuyển hóa “link equity” từ Non-Canonical sang Canonical.
Đặt URL đã được chuẩn hóa thành ‘noindex’
Điều bạn cần nhớ, tốt nhất là không nên kết hợp giữa noindex với thẻ canonical lại với nhau. Bởi vì cả 2 là yếu tố hoàn toàn đối lập nhau.
Thường Google có sự ưu tiên Canonical hơn thẻ là thẻ “noindex”. Trong trường hợp bạn muốn thực hiện đồng thời 2 việc là noindex và gắn thẻ Tag, thì hãy sử dụng chuyển đổi 301 redirects. Nếu không thì chỉ nên dùng duy nhất thẻ rel = canonical thôi.
Đặt mã trạng thái HTTP 4XX vào URL gốc
Đối với việc đặt mã HTTP 4XX cho URL gốc có ảnh hướng giống như việc bạn dùng thẻ “noindex”. Làm cho Google sẽ không thể nhìn thấy Canonical Tag để mà chuyển “link quity” sang bản gốc.
Chuẩn hóa tất cả các Paginated Page đến Page gốc
Điều quan trọng bạn cần lưu ý là các paginated page không nên được triển khai Canonical URL đến các paginated page đầu tiên trong chuỗi. Thay vào đó, bạn nên dùng thẻ Tag tự tham chiếu trên những trang web này.
John Mueller đã đưa ra lời giải thích hợp lý cho nghi vấn này là: Nếu page A không trùng lặp page B. Thì việc page B đang dùng thẻ rel=canonical muốn trỏ đến page A sẽ không được phép chấp thuận vì dùng thẻ rel = canonical không đúng cách.
Bạn nên hạn chế việc dùng thẻ rel=”prev” và thẻ rel=”next” để phân trang. Mặc dù cấu trúc này không còn thịnh hành đối với Google như một số website khác, giống như trang Bing vẫn còn đang sử dụng nó.
Chưa sử dụng Canonical Tags với Hreflang
Hreflang tags được sử dụng với mục đích chỉ định target đối tượng thông qua ngôn ngữ và vị trí địa lý của website.
Google khuyên bạn rằng khi muốn dùng hreflang thì nên chỉ định trang gốc có cùng một ngôn ngữ nhất định với website hoặc dùng ngôn ngữ thay thế tốt nhất với trường hợp không thể tìm ra ngôn ngữ chung cho cả 2”.
Sử dụng quá nhiều thẻ rel=canonical
Khi bạn sử dụng quá nhiều thẻ rel = canonical sẽ khiến Google dễ dàng bỏ qua mọi thứ trên website của bạn.
Việc này xảy ra khi bạn thêm các thẻ vào hệ thống ở các điểm khác nhau: Ví dụ như CMS, theme và các plugin. Đây là lý do tại sao nhiều plugin lựa chon ghi đè giúp đảm bảo chúng là nguồn duy nhất cho các Canonical URL.
Cũng cso một số trường hợp khác khi thẻ rel = canonical được thêm vào bởi JavaScript. Google sẽ chấp thuận trường hợp này chỉ khi URL gốc không tồn tại trên HTML và sau đó bạn có quyền thêm thẻ rel = canonical với JavaScript.
Ngược lại, nếu HTML đã có thẻ URL rồi mà bạn lại tiếp tục hoán đổi page khác ưa thích bằng JavaScript. Thì có lẽ bạn đang làm Google khó nhận dạng bởi hàng loạt tín hiệu hỗn hợp đấy. Bạn hãy cẩn thận điều này nhé!
Đặt rel=canonical ở trong phần Body của trang web
Thẻ Rel = canonical của bạn chỉ nên xuất hiện trong <head> của tài liệu. Vì thông thường thẻ chuẩn trong phần <body> của web rất dễ bị Google bỏ qua.
Mặc dù mã nguồn của một trang web có thể có thẻ rel = canonical đang nằm ở đúng vị trí, nhưng khi nó được tạo ra trong trình duyệt hoặc được hiển thị bởi công cụ Google thì sẽ xảy ra mộ số vấn đề như: thẻ URL không được đóng, JavaScript bị chèn hoặc <iframes> trong phần <head>,… khiến <head> sẽ phải dùng lại sớm trong khung trình duyệt.
Nếu xảy ra trường hợp này, thì thẻ Tag sẽ bị chuyển vào <body> của một trang đang hiển thị mà không được chấp thuận.
Sử dụng nâng cao của thẻ rel = canonical
HTTP header Canonical link
Google cũng góp phần hỗ trợ HTTP header Canonical link trong trang web của bạn. Tiêu đề được hiển thị dưới dạng như sau:
link: <https://www.example.com/white-apers.pdf>; rel = “canonical”
Các HTTP header được liên kết với Canonical có thể rất hữu ích khi bắt đầu chuẩn hóa các tệp như PDF, vì vậy tệp này tồn tại là điều tuyệt vời phải không.
Sử dụng rel = canonical trên các trang web khác nhau
Mặc dù không khuyến khích các bạn làm điều này, nhưng bạn chắc chắn có thể sử dụng thẻ rel = canonical rất tích cực. Google luôn tôn vinh mục đích nó đến một mức độ bạn có thể nghĩ nó là điều thần dược, nó có thể giúp bạn hợp thức hóa một phần nội dung mới lạ với một phần nội dung khác. Tuy nhiên, nếu Google bắt buộc bạn phải làm điều này, khi nó sẽ ngừng tin tưởng vào canonical của trang web bạn và do đó sẽ gây hại nhiều cho wesite của bạn.
Sử dụng thẻ rel = canonical liên kết đến thẻ hreflang
Kết hợp canonical với hreflang. Điều quan trọng trong việc kết hợp này là khi bạn sử dụng hreflang, mỗi ngôn ngữ đều có canonical trỏ đến chính nó. Hãy chắc chắn rằng bạn biết nên làm gì để sử dụng tốt canonical khi bạn thực hiện hreflang, vì nếu không, bạn có thể giết toàn bộ việc thực hiện kết hợp thẻ canonical url với hreflang của mình.
Những lưu ý cần nhớ khi dùng Canoical URL
- Có một vài trường hợp phổ biến bạn nên dùng chuyển hướng 301 thay vì sử dụng thẻ Canonical Url. Điều này rất quan trọng và đặt biệt chỉ sử dụng đối với những phiên bản có www và không có www, hay giao thức http và https.
- Bạn nên nhớ chỉ sử dụng thuộc tính rel=”canonical” khi một lúc có 2 hay nhiều trang cùng 1 nội dung bị trùng lặp là đáng kể. Nếu bị trùng lặp ít thì không nên thông báo, còn nếu không thì bạn đã làm lãng phí nguồn lực khi thực hiện khai báo có 1 trang có url phụ, đồng thời sẽ không được tính và xếp vào kho dữ liệu của bạn.
- Một khi có thông báo Url chuẩn và công cụ tìm kiếm (SE) đánh giá cao việc này thì SE không còn có nghĩa vụ phải sử dụng Url chuẩn. Những SE phải có thuật toán riêng để thực hiện việc đánh giá, và do đó vẫn có khả năng tự quyết định đâu mới là một Url chuẩn trong số những trang được coi là có trùng lặp nội dung.
Lời kết
Vậy là qua bài viết trên SPSEO đã gửi đến bạn những thông tin bổ ích về Canonical Url là gì? Bên cạnh đó đưa ra những lưu ý khi sử dụng Canonical Url để bạn tham khảo. Huy vọng bài viết giúp bài giải đáp thắc mắc về SEO trong thời gian qua.