Kỹ thuật Cloaking là gì? Tìm Hiểu Về Kỹ Thuật Che Giấu Nội Dung
24/07/2023 10:19 am | Lượt xem : 2312
Kỹ thuật Cloaking là một kỹ thuật SEO mũ đen nhằm đánh lừa công cụ tìm kiếm bằng cách hiển thị nội dung khác nhau cho người dùng và bot thu thập thông tin.
Contents
- Kỹ thuật SEO là gì?
- Các kỹ thuật cloaking phổ biến
- Tại sao nên tránh cloaking trong SEO?
- Cách nhận biết một trang web có sử dụng cloaking hay không?
- Sử dụng các công cụ kiểm tra cloaking
- So sánh nội dung của trang web khi xem bằng các trình duyệt khác nhau hoặc các thiết bị khác nhau.
- So sánh nội dung của trang web khi xem bằng chế độ xem mã nguồn hoặc chế độ xem cache của Google.
- So sánh nội dung của trang web khi xem bằng các công cụ giả lập user agent
- So sánh nội dung của trang web khi xem bằng các công cụ giả lập IP
- So sánh nội dung của trang web khi xem bằng các công cụ giả lập referer
- Bài viết liên quan:
Kỹ thuật SEO là gì?
SEO (Search Engine Optimization) là một trong những phương pháp quan trọng để tăng lượng truy cập và thứ hạng của trang web trên các công cụ tìm kiếm như Google, Bing, Yahoo, v.v. Tuy nhiên, không phải tất cả các kỹ thuật SEO đều được coi là hợp lệ và chấp nhận được. Một số kỹ thuật SEO được gọi là mũ đen (black hat), tức là những kỹ thuật vi phạm các nguyên tắc quản trị trang web của các công cụ tìm kiếm và có thể gây ra những hậu quả tiêu cực cho trang web nếu bị phát hiện. Một trong những kỹ thuật SEO mũ đen phổ biến nhất là cloaking.
Kỹ thuật Cloaking là gì?
Kỹ thuật Cloaking là một kỹ thuật SEO mũ đen nhằm đánh lừa công cụ tìm kiếm bằng cách hiển thị nội dung khác nhau cho người dùng và bot thu thập thông tin.
Bot thu thập thông tin là những chương trình máy tính được sử dụng bởi các công cụ tìm kiếm để quét và lập chỉ mục các trang web trên internet. Khi một bot thu thập thông tin truy cập một trang web sử dụng cloaking, nó sẽ nhìn thấy một phiên bản của trang web được tối ưu hóa cho các từ khóa và các yếu tố SEO khác, trong khi khi một người dùng truy cập trang web đó, họ sẽ nhìn thấy một phiên bản khác của trang web có nội dung khác, có thể không liên quan hoặc không chất lượng.
Mục đích của kỹ thuật Cloaking là để lừa các công cụ tìm kiếm cho rằng trang web có nội dung chất lượng cao và xứng đáng được xếp hạng cao cho các từ khóa mục tiêu. Trong khi thực tế trang web có thể không có nội dung hữu ích cho người dùng hoặc có nội dung vi phạm các chính sách của các công cụ tìm kiếm, ví dụ như nội dung spam, nội dung sao chép, nội dung 18+, v.v.
Cloaking là một vi phạm nghiêm trọng của nguyên tắc quản trị trang web của Google và có thể bị phạt hoặc cấm lập chỉ mục. Google coi cloaking là một hình thức lừa đảo và không công bằng với người dùng và các trang web khác. Google khuyến cáo các webmaster không sử dụng cloaking và cung cấp nội dung giống nhau cho người dùng và bot thu thập thông tin.
Các kỹ thuật cloaking phổ biến
Che giấu tác nhân người dùng
Tác nhân người dùng (user agent) là một chuỗi ký tự được gửi bởi một trình duyệt hoặc một chương trình khác để xác định loại và phiên bản của chương trình đó. Ví dụ, tác nhân người dùng của Google Chrome là:
Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/91.0.4472.114 Safari/537.36
Tác nhân người dùng của bot thu thập thông tin của Google là:
Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)
Khi một trình duyệt hoặc một chương trình khác yêu cầu một trang web, nó sẽ gửi tác nhân người dùng của nó cho máy chủ của trang web. Máy chủ của trang web có thể sử dụng tác nhân người dùng để xác định loại và phiên bản của trình duyệt hoặc chương trình đó và hiển thị nội dung phù hợp cho nó.
Che giấu tác nhân người dùng là một kỹ thuật cloaking sử dụng tác nhân người dùng để phát hiện bot thu thập thông tin và hiển thị nội dung khác nhau cho bot và người dùng. Ví dụ, một trang web có thể cấu hình máy chủ của nó để hiển thị nội dung được tối ưu hóa cho SEO khi nhận được yêu cầu từ tác nhân người dùng của Googlebot, và hiển thị nội dung khác khi nhận được yêu cầu từ các tác nhân người dùng khác.
IP cloaking
IP (Internet Protocol) là một giao thức mạng được sử dụng để giao tiếp giữa các thiết bị kết nối internet. Mỗi thiết bị kết nối internet được gán một địa chỉ IP duy nhất để xác định và phân biệt với các thiết bị khác. Ví dụ, địa chỉ IP của máy tính của bạn có thể là:
192.168.1.100
Địa chỉ IP của bot thu thập thông tin của Google có thể là:
66.249.66.1
Khi một thiết bị yêu cầu một trang web, nó sẽ gửi địa chỉ IP của nó cho máy chủ của trang web. Mục đích của kỹ thuật IP cloaking là để lừa các công cụ tìm kiếm cho rằng trang web có nội dung chất lượng cao và xứng đáng được xếp hạng cao cho các từ khóa mục tiêu, trong khi thực tế trang web có thể không có nội dung hữu ích cho người dùng hoặc có nội dung vi phạm các chính sách của các công cụ tìm kiếm
Cloaking dựa trên referer
Kỹ thuật Cloaking dựa trên referer là một kỹ thuật SEO mũ đen nhằm đánh lừa công cụ tìm kiếm bằng cách hiển thị nội dung khác nhau cho người dùng và bot thu thập thông tin dựa trên referer của người yêu cầu trang web.
Referer là một tiêu đề HTTP được gửi bởi một trình duyệt hoặc một chương trình khác khi yêu cầu một trang web, để cho biết trang web nào đã liên kết đến trang web đó.
Ví dụ, nếu bạn nhấp vào một liên kết từ trang A đến trang B, thì referer của yêu cầu đến trang B sẽ là URL của trang A.
Cloaking dựa trên referer là một kỹ thuật cloaking sử dụng referer để phát hiện bot thu thập thông tin và hiển thị nội dung khác nhau cho bot và người dùng. Ví dụ, một trang web có thể sử dụng referer để kiểm tra xem yêu cầu có đến từ trang kết quả tìm kiếm của Google hay không, và hiển thị nội dung được tối ưu hóa cho SEO cho những yêu cầu đó, và hiển thị nội dung khác cho những yêu cầu không đến từ Google.
JavaScript cloaking
Khi một trình duyệt hoặc một chương trình khác yêu cầu một trang web, nó sẽ tải và chạy JavaScript của trang web nếu được cho phép. JavaScript của trang web có thể sử dụng các phương thức như window.location hoặc document.write để chuyển hướng người dùng sang nội dung khác hoặc ghi đè lên nội dung hiện có của trang web.
JavaScript cloaking là một kỹ thuật cloaking sử dụng JavaScript để phát hiện bot thu thập thông tin và hiển thị nội dung khác nhau cho bot và người dùng. Ví dụ, một trang web có thể sử dụng JavaScript để kiểm tra xem trình duyệt có hỗ trợ JavaScript hay không, và hiển thị nội dung được tối ưu hóa cho SEO cho những trình duyệt không hỗ trợ JavaScript (như bot thu thập thông tin), và hiển thị nội dung khác cho những trình duyệt hỗ trợ JavaScript.
Kỹ thuật che giấu tiêu đề ngôn ngữ chấp nhận HTTP
Tiêu đề ngôn ngữ chấp nhận HTTP (Accept-Language header) là một tiêu đề HTTP được gửi bởi một trình duyệt hoặc một chương trình khác khi yêu cầu một trang web, để cho biết ngôn ngữ mà người dùng mong muốn xem nội dung của trang web. Ví dụ, tiêu đề ngôn ngữ chấp nhận HTTP của một người dùng muốn xem nội dung bằng tiếng Việt là:
Accept-Language: vi
Khi một trình duyệt hoặc một chương trình khác yêu cầu một trang web, nó sẽ gửi tiêu đề ngôn ngữ chấp nhận HTTP của nó cho máy chủ của trang web. Máy chủ của trang web có thể sử dụng tiêu đề ngôn ngữ chấp nhận HTTP để xác định ngôn ngữ mong muốn của người dùng và hiển thị nội dung phù hợp cho nó.
Kỹ thuật che giấu tiêu đề ngôn ngữ chấp nhận HTTP là một kỹ thuật cloaking sử dụng tiêu đề ngôn ngữ chấp nhận HTTP để phát hiện bot thu thập thông tin và hiển thị nội dung khác nhau cho bot và người dùng.
Ví dụ, một trang web có thể sử dụng tiêu đề ngôn ngữ chấp nhận HTTP để kiểm tra xem yêu cầu có đến từ bot thu thập thông tin của Google hay không, và hiển thị nội dung được tối ưu hóa cho SEO cho những yêu cầu có tiêu đề ngôn ngữ chấp nhận HTTP là en (tiếng Anh), và hiển thị nội dung khác cho những yêu cầu có tiêu đề ngôn ngữ chấp nhận HTTP khác.
Cloaking dựa trên session
Session là một khái niệm trong lập trình web, được sử dụng để lưu trữ thông tin về thời gian mà người dùng duyệt trang web. Session có thể được tạo ra bằng cách sử dụng các biến phiên (session variables) hoặc các cookie phiên (session cookies). Session có thể được sử dụng để lưu trữ các thông tin như tên đăng nhập, giỏ hàng, lịch sử duyệt, v.v.
Khi một trình duyệt hoặc một chương trình khác yêu cầu một trang web, nó sẽ gửi các thông tin về session của nó cho máy chủ của trang web. Máy chủ của trang web có thể sử dụng các thông tin về session để xác định thời gian và tần suất của người dùng duyệt trang web và hiển thị nội dung phù hợp cho nó.
Cloaking dựa trên session là một kỹ thuật cloaking sử dụng session để phát hiện bot thu thập thông tin và hiển thị nội dung khác nhau cho bot và người dùng. Ví dụ, một trang web có thể sử dụng session để kiểm tra xem người dùng có duyệt trang web lâu hay không, và hiển thị nội dung được tối ưu hóa cho SEO cho những người dùng duyệt trang web nhanh (như bot thu thập thông tin), và hiển thị nội dung khác cho những người dùng duyệt trang web lâu.
Tại sao nên tránh cloaking trong SEO?
Kỹ thuật Cloaking trong SEO là một kỹ thuật không được khuyến khích và có thể gây ra những hậu quả tiêu cực cho trang web, như:
Mất PA (Page Authority) và DA (Domain Authority)
PA và DA là hai chỉ số đo lường mức độ uy tín và chất lượng của một trang web hoặc một trang web riêng lẻ. PA và DA được ảnh hưởng bởi nhiều yếu tố, trong đó có số lượng và chất lượng của các liên kết đến trang web hoặc trang web đó. Nếu một trang web sử dụng kỹ thuật cloaking, nó có thể bị mất các liên kết đến nó do người dùng không tìm thấy nội dung mong muốn hoặc không tin tưởng vào nội dung của nó. Điều này sẽ làm giảm PA và DA của trang web đó.
Giảm vị trí của SERP (Trang kết quả của Công cụ Tìm kiếm)
SERP là danh sách các kết quả được hiển thị bởi các công cụ tìm kiếm khi người dùng nhập vào một từ khóa hoặc một câu hỏi. Vị trí của SERP là thứ tự xếp hạng của các kết quả đó. Vị trí của SERP được ảnh hưởng bởi nhiều yếu tố, trong đó có nội dung và SEO của các kết quả đó.Web sử dụng kỹ thuật cloaking, nó có thể bị phát hiện bởi các công cụ tìm kiếm và bị giảm vị trí của SERP do vi phạm các nguyên tắc quản trị trị trang web của các công cụ tìm kiếm. Điều này sẽ làm giảm lượng truy cập và doanh thu của trang web đó.
Cấm lập chỉ mục trang web
Lập chỉ mục là quá trình mà các công cụ tìm kiếm thu thập và lưu trữ thông tin về các trang web trên internet để hiển thị chúng cho người dùng khi có yêu cầu tìm kiếm phù hợp.
Nếu một trang web sử dụng cloaking, nó có thể bị cấm lập chỉ mục bởi các công cụ tìm kiếm do đánh lừa và gây nhầm lẫn cho người dùng và bot thu thập thông tin. Điều này sẽ làm cho trang web đó không thể được tìm thấy hoặc khó được tìm thấy bởi người dùng.
Mất niềm tin của người dùng và giảm tỷ lệ chuyển đổi
Niềm tin của người dùng là một yếu tố quan trọng để xây dựng và duy trì mối quan hệ giữa người dùng và trang web. Niềm tin của người dùng được ảnh hưởng bởi nhiều yếu tố, trong đó có nội dung và chất lượng của trang web. Nếu một trang web sử dụng kỹ thuật cloaking, nó có thể làm mất niềm tin của người dùng do không cung cấp nội dung mong muốn hoặc nội dung không phù hợp với kỳ vọng của người dùng. Điều này sẽ làm giảm tỷ lệ chuyển đổi, tức là tỷ lệ mà người dùng thực hiện các hành động mong muốn trên trang web, ví dụ như đăng ký, mua hàng, liên hệ, v.v.
Vi phạm các nguyên tắc quản trị trang web của Google và các công cụ tìm kiếm khác
Nguyên tắc quản trị trang web là một bộ quy tắc được thiết lập bởi các công cụ tìm kiếm để hướng dẫn các webmaster về cách thiết kế và phát triển các trang web theo cách thân thiện với người dùng và công cụ tìm kiếm. Nguyên tắc quản trị trang web cũng nhằm ngăn chặn các hành vi gian lận và lừa đảo trong SEO. Nếu một trang web sử dụng kỹ thuật cloaking có thể bị coi là một hành vi gian lận và lừa đảo trong SEO.
Cách nhận biết một trang web có sử dụng cloaking hay không?
Có một số cách để kiểm tra xem một trang web có sử dụng kỹ thuật cloaking hay không, như:
Sử dụng các công cụ kiểm tra cloaking
Có nhiều công cụ kiểm tra cloaking có sẵn trên internet, cho phép bạn nhập vào URL của một trang web và xem nội dung của trang web đó khi được truy cập bởi các bot thu thập thông tin khác nhau. Ví dụ, bạn có thể sử dụng công cụ kiểm tra cloaking sau:
smallseotools(.)com/cloaking-checker/
Công cụ này sẽ cho bạn biết nội dung của trang web khi được truy cập bởi Googlebot, Bingbot, Yahoo! Slurp và Yandexbot. Nếu nội dung của trang web khác nhau khi được truy cập bởi các bot thu thập thông tin khác nhau, có thể trang web đó đang sử dụng cloaking.
So sánh nội dung của trang web khi xem bằng các trình duyệt khác nhau hoặc các thiết bị khác nhau.
Một cách đơn giản để kiểm tra cloaking là so sánh nội dung của trang web khi xem bằng các trình duyệt khác nhau hoặc các thiết bị khác nhau. Ví dụ, bạn có thể xem trang web bằng Google Chrome, Firefox, Safari, Internet Explorer, v.v. hoặc bằng máy tính, điện thoại, máy tính bảng, v.v.
Nếu nội dung của trang web khác nhau khi xem bằng các trình duyệt khác nhau hoặc các thiết bị khác nhau, có thể trang web đó đang sử dụng cloaking.
So sánh nội dung của trang web khi xem bằng chế độ xem mã nguồn hoặc chế độ xem cache của Google.
So sánh nội dung của trang web khi xem bằng chế độ xem mã nguồn hoặc chế độ xem cache của Google. Chế độ xem mã nguồn là một tính năng của các trình duyệt cho phép bạn xem mã HTML của một trang web.
Chế độ xem cache của Google là một tính năng của Google cho phép bạn xem phiên bản lưu trữ của một trang web được Google lập chỉ mục gần đây nhất. Bạn có thể xem chế độ xem cache của Google bằng cách nhập vào thanh tìm kiếm của Google:
https://webcache(.)googleusercontent(.)com/search?q=cache:URL
Với URL là địa chỉ của trang web bạn muốn kiểm tra.
Nếu nội dung của trang web khi xem bằng chế độ xem mã nguồn hoặc chế độ xem cache của Google khác với nội dung khi xem bình thường, có thể trang web đó đang sử dụng cloaking.
So sánh nội dung của trang web khi xem bằng các công cụ giả lập user agent
Một cách nâng cao hơn để kiểm tra cloaking là so sánh nội dung của trang web khi xem bằng các công cụ giả lập user agent. Các công cụ giả lập user agent là những chương trình cho phép bạn thay đổi user agent của trình duyệt hoặc chương trình của bạn để giả vờ là một loại và phiên bản khác.
Ví dụ, bạn có thể sử dụng các công cụ giả lập user agent để giả vờ là Googlebot, Bingbot, Yahoo! Slurp, Yandexbot, v.v.
Công cụ này sẽ cho bạn biết user agent hiện tại của bạn và cho phép bạn chọn một user agent khác để giả lập. Nếu nội dung của trang web khi xem bằng các công cụ giả lập user agent khác với nội dung khi xem bình thường, có thể trang web đó đang sử dụng cloaking.
So sánh nội dung của trang web khi xem bằng các công cụ giả lập IP
Một cách nâng cao hơn nữa để kiểm tra cloaking là so sánh nội dung của trang web khi xem bằng các công cụ giả lập IP. Các công cụ giả lập IP là những chương trình cho phép bạn thay đổi địa chỉ IP của thiết bị của bạn để giả vờ là ở một vị trí hoặc sử dụng một dịch vụ internet khác.
Ví dụ, bạn có thể sử dụng các công cụ giả lập IP để giả vờ là ở một quốc gia hoặc một khu vực khác, hoặc sử dụng một máy chủ proxy hoặc một VPN.
Nếu nội dung của trang web khi xem bằng các công cụ giả lập IP khác với nội dung khi xem bình thường, có thể trang web đó đang sử dụng cloaking.
So sánh nội dung của trang web khi xem bằng các công cụ giả lập referer
Một cách nâng cao nhất để kiểm tra cloaking là so sánh nội dung của trang web khi xem bằng các công cụ giả lập referer. Các công cụ giả lập referer là những chương trình cho phép bạn thay đổi referer của trình duyệt hoặc chương trình của bạn để giả vờ là đến từ một trang web khác. Ví dụ, bạn có thể sử dụng các công cụ giả lập referer để giả vờ là đến từ trang kết quả tìm kiếm của Google, Bing, Yahoo, v.v.
Bài viết liên quan:
Website SPA là gì? Kỹ thuật SEO đặc biệt cho website SPA
Ra mắt AI Easy Content – Trợ lý tạo nội dung hàng loạt unique, đáp ứng SEO giúp tiết kiệm thời gian
Textlink là gì? Cách sử dụng Textlink trong SEO một cách an toàn