RSSSEO

Duplicate trong SEO

Hiện nay các bộ máy tìm kiếm và đặc biệt là Google xem xét rất kỹ việc duplicate content hay còn gọi là trùng lặp nội dung. Việc trùng lặp nội dung giữa các website thường mang đến nhiều phiền toái cho tác giả, người trích lại hoặc ngay cả cho người tham quan website.

Vấn đề càng trở nên cấp thiết hơn khi rất nhiều trang web đã bị đánh rớt hạng trên các công cụ tìm kiếm, đơn giản vì lỗi duplicate content. Để hiểu rõ hơn về duplicate content chúng ta hãy tham khảo một số dạng duplicate sau đây:

Duplicate content : nghĩa là trùng lặp nội dung giữa các URL khác nhau cùng truy xuất một web page. Ví dụ : 
http://danweb.vn/index.php
http://danweb.vn/

Cả 2 URL trên đều cùng trỏ về trang chủ của Dân Web.

Có 2 loại duplicate content mà bạn nên chú ý. Đó là duplicate trong trang và duplicate ngoài trang.

1. Duplicate trong trang :

Nội dung bị trùng lặp bởi các URL cùng thuộc tên miền của trang. Ví dụ phía trên là một dạng duplicate trong trang. Ngoài ra duplicate trong trang còn một số dạng duplicate như sau:

1.1 Session ID :

Ví dụ:
http://example.com/web?ID=123
http://example.com/web

Cả 2 cùng trỏ về một nội dung trên website.

1.2 Tham số thuộc tính trên URL

Ví dụ :
http://example.com/web?color=red
http://example.com/web-red

Cả 2 cùng trỏ về nội dung web màu đỏ trên website.

1.3 Thư mục trên URL

Ví dụ :
http://example.com/web/design
http://example.com/design

Cả 2 cùng trỏ về cùng một nội dung trên website mặc dù đường dẫn thư mục khác nhau.

1.4 Các tag trên URL

Ví dụ :
http://example.com/tag/web-design           
http://example.com/web

Các 2 cùng trỏ về cùng một nội dung. Chức năng tag này thường được rất nhiều người sử dụng, nhưng nếu không để ý chuyển đổi sang một URL duy nhất thì lỗi duplicate sẽ xuất hiện.

2. Duplicate ngoài trang:

Duplicate ngoài trang có 2 trường hợp đáng chú ý. Trường hợp duplicate do trích dẫn lại hoặc duplicate do cố ý spam.

2.1 Duplicate do trích dẫn :

Dễ thấy nhất là các trang báo, tin tức hoặc các nội dung hay thường được các trang khác trích dẫn lại. Điều này là tốt nhưng đôi khi cũng gây ra nhiều sự phiền toái. Các search engine không nhận được đâu là bài gốc, thường thì search engine dựa vào độ trust của trang hoặc thời điểm index để xác định nội dung gốc.

Nhưng cũng sẽ xảy ra trường hợp trang có độ trust cao trích dẫn lại trang có độ trust thấp, làm cho trang chủ nội dung gặp nhiều thiệt thòi trong lỗi duplicate.

2.2 Duplicate do cố ý spam :

Một số đối thủ sử dụng thủ thuật làm mờ mắt search engine khi nhân bản ra hàng loạt nội dung giống nhau trên cả trang có độ trust cao cũng như trang có độ trust thấp.

Bạn cũng biết rằng không phải lúc nào nội dung trên web của bạn cũng được index trước, đôi khi Google vẫn lầm tưởng nội dung mà bạn viết ra chính là duplicate content với các nội dung mà đối thủ mang đi spam.

Tổng hợp lại, có 2 loại duplicate content : duplicate trong trangduplicate ngoài trang. Khi bạn nhận diện được chúng bước tiếp theo là bạn phải suy nghĩ làm thế nào để chuyển đổi các nội dung trùng lập về một phiên bản, giúp các search engine dễ dàng đánh dấu được đâu là nội dung của bạn, việc này vừa giúp bạn nâng cao độ trust của website đồng thời cũng tránh được những sự hiểu lầm không cần thiết của search engine đối với website của bạn.

Khánh La

Tags:

Nếu bạn thấy bài viết hữu ích, hãy nhấn +1 và các liên kết chia sẻ để website ngày càng phát triển hơn. Xin cám ơn bạn!

Nếu là khách, bạn phải đăng ký tài khoản và kích hoạt tài khoản để bình luận được hiển thị ở đây.
Thông tin kích hoạt gửi đến mail của bạn.

Tin mới hơn

Tin cũ hơn

Lên trên đầu