Khi nói đến SEO thì không thể nào không nhắc đến các thuật toán cốt lõi bên trong bộ máy tìm kiếm lớn nhất hiện nay. Với chuỗi bài viết về các về các thuật toàn quan trọng của Google sẽ mang đến những thông tin hưu ích đặc biệt là các bạn newbie mới bước chân vào lĩnh vực SEO.
Thuật toán đầu tiên mà chúng ta sẽ tìm hiểu và thảo luận đó chính là thuật toán Google Panda Back. Vậy Google Panda là gì? Nó tác động về vấn đề nào trong SEO? Hãy cùng TGHmedia tìm hiểu ngay sau đây.
Google panda là gì?
Thuật toán Google Panda được ra mắt từ 2/2011. Google Panda giúp loại bỏ các nội dung rác, nội dung Copy và Website kém chất lượng. Thuật toán này còn thay đổi cách xếp hạng trên SERP (trang kết quả tìm kiếm) tốt và công bằng giúp trả về các kết quả chính xác và phù hợp nhất.
Tóm lại Google Panda sẽ làm gì:
- Xem xét chất lượng nội dung website loại bỏ phần nội dung sai phạm, nội dung rác hoặc được copy từ những trang khác.
- Làm giảm sự hiện diện của các trang web kém chất lượng thấp trong kết quả Organic Search của Google.
- Thưởng cho các trang web chất lượng cao.
Các yếu tố đánh giá cơ bản của thuật toán Panda:
- Độ tin cậy của thông tin: chất lượng nội dung website
- Nội dung page: ngôn ngữ tự nhiên không nhồi nhét từ khóa, hình ảnh tối ưu.
- Internal link: mật độ internal link trên site
- Độ tương tác với người xem: Các yếu tố như time on site và page view là những yếu tố giúp Google đánh giá độ tương tác với người xem
- Bounce rate: Tỉ lệ % người vào xem đúng 1 trang rồi thoát, bounce rate cao tức là người xem không thích nội dung trang hoặc không phù hợp với những gì họ cần
- Thiết kế website: Bố cục rõ ràng và thân thiện với người xem
- Quảng cáo: 1 trang web đặt quá nhiều quảng cáo có thể bị Google đánh giá ko cao.
Những nguyên nhân khiến bạn bị Panda phạt
Nội dung mỏng, thông tin ít (Thin content)- Nội dung có chất lượng thấp
Thin content (hay còn gọi là nội dung mỏng) là những bài viết có nỗi dụng ngắn, Content rác, chất lượng thấp. Về chất lượng content thấp có thể kể đến các lỗi như:
- Nội dung copy từ web khác.
- Nội dung không cung cấp giá trị hữu ích cho người đọc.
- chủ đề ở mỗi bài viết không liên quan nhiều đến lĩnh vực chính của website, không đồng nhất về chủ đề.
Các website cung cấp ít giá trị hoặc nội dung chất lượng thấp cho người đọc vì thiếu thông tin chuyên sâu. Nội dung content thường:
- Truyền tải vắn tắt, qua loa.
- Thiếu ý
- Không phân tích chuyên sâu, ít có sự đào sâu nghiên cứu.
- Ít tìm tòi, mở rộng chủ đề
Trùng lặp nội dung (Duplicate content)
Trùng lặp nội dung là hiện tượng có cùng nội dung trên 2 đường dẫn URL khác nhau. Cho dù nó trên một website hay trên các website khác nhau, thì đều bị coi là trùng lặp nội dung.
Google tính trùng lặp về nội dung theo:
- Nội dung từng trang;
- Thẻ meta description;
- Thẻ heading;
- Code HTML;
- Khung giao diện;
- Khung design mặc định của website (Ví dụ: bài viết chữ quá ít nhưng khung design lại lớn).
Tại sao Code web, khung giao diện Khung design lại được nhắc đến?
- Khi cào (crawl) dữ liệu website thì Google bot sẽ cào code html từ trên xuống dưới, từ trái sang phải.
- Khung design mặc định của website giống nhau mỗi trang cũng được tính là trùng lặp. HTML của bạn phải unique 51% thì website mới an toàn. Nếu 1 bài của bạn chỉ cỡ 300 – 400 chữ mà khung design cố định của website lớn thì chắc chắn website bạn bị trùng lặp.
Website thiếu Authority-không có độ tin tưởng cao
Nội dung được tạo ra bởi các nguồn không được xác minh, thiếu thẩm quyền (authority), thiếu độ tin cậy (trust) cho người dùng. Điều đó sẽ làm webiste của bạn bị Google Panda loại bỏ ngay lập tức.
Content farming
Content farming là thuật ngữ dùng để ám chỉ các website spam nội dung, thu thập và copy content của các web khác, sau đó bị nhồi nhét rất nhiều từ khóa và tối ưu SEO tốt hơn so với web gốc.
Website có quá nhiều nội dung quảng cáo
Website chủ yếu đặt nhiều banner quảng cáo với rất ít nội dung thực sự cung cấp giá trị cho người đọc. Hầu hết các web này được tạo ra để kiếm tiền từ việc đặt banner quảng cáo, ít nội dung.
Lỗi Schema
Việc khai báo Schema là hết sức quan trọng, phải theo đúng theo công thức, đủ thông tin và chuẩn xác. Google đưa ra quy luật rõ ràng về vấn đề Schema như sau:
Nếu bạn khai gì trên schema thì người dùng phải thấy y như vậy trên website của bạn.
Ví dụ: bạn làm schema review và khai rằng website đang có 100 lượt review trên website, đồng thời website được đánh giá 5 sao,… thì lẽ dĩ nhiên, tất cả thông số ấy phải hiển thị chính xác trên trang web bạn đang quản lý.
Nếu các thông tin này sai lệch hay nói cách khác là schema bạn làm sai với quy luật của Google; đến lúc nào đó Google scan qua và thu thập đủ dữ liệu về bạn, nó sẽ tiến hành phạt bạn ngay.
Các liên kết trỏ đến website của bạn mang những nội dung kém chất lượng
Hiểu nôm na là việc tạo ra nhiều backlink với những nội dung copy từ các website khác; hoặc đã Spin content (trộn nội dung) lại với nhau để cho ra những bài viết mới.
Bài viết mới có thể cùng ý nghĩa với bài viết gốc nhưng khác về mặt câu chữ hoặc cũng có thể mang ý nghĩa khác hoàn toàn so bài viết gốc. Tuy nhiên, hình thức Spin Content tạo ra những nội dung này, đã được Google xem như là nội dung rác.
Trang web bị người dùng chặn
Các trang web mà người dùng đang chặn trực tiếp trong kết quả của công cụ tìm kiếm hoặc bằng cách sử dụng tiện ích mở rộng của trình duyệt Chrome để làm như vậy, cho thấy chất lượng thấp.
Nội dung không phù hợp với truy vấn tìm kiếm
Các trang “hứa hẹn” cung cấp câu trả lời có liên quan nếu được nhấp vào trong kết quả tìm kiếm, nhưng sau đó không thực hiện được. Ví dụ: một trang web có thể có tiêu đề “Phiếu giảm giá cho Whole Foods”, nhưng khi nhấp vào, có thể không có phiếu giảm giá hoặc có thể chỉ có một trang quảng cáo, dẫn đến sự thất vọng.
Cách nhận biết bạn có thể đã bị panda phạt
Organic traffic giảm dần theo thời gian. Đây được xem là dấu hiệu phổ biến và dễ nhận diện nhất. Ở khoảng thời gian đầu giảm traffic, có thể bạn thấy nó không ảnh hưởng gì nhiều.
Tuy nhiên, qua 1 hay 2 tháng, thậm chí chỉ vỏn vẹn vài tuần, bạn sẽ nhận ra ngay độ giảm sút traffic ngày càng mạnh mẽ, trầm trọng. Nó kéo theo hàng loạt ảnh hưởng tiêu cực khác mà Google Panda mang đến cho website của bạn.
Nếu website bạn gặp tình trạng trùng lặp nội dung với số lượng ít thì Panda sẽ không phạt liền. Mà chờ đến khi mức trùng lặp lên đến 20%-30% mới kéo hẳn traffic xuống.
Một dấu hiệu nhận biết Google Panda khác nữa là:
Website đang hoạt động tốt bỗng dưng lại mất đi 1/2 traffic. Từ đó khiến website từ top đầu trang 1 lập tức bay vèo xuống cuối trang 1 hay qua đến trang 2. Lúc này, số lượng organic traffic vẫn có nhưng còn rất ít và không đáng kể.
Công cụ hỗ trợ và cách khắc phục sau khi bị phạt
Bản cập nhật Panda chủ yếu dựa trên chất lượng trang web – nội dung. Vì thế các bước phục hồi thường tập trung vào cải thiện chất lượng trang web đó.
Kỹ thuật Noindex và thẻ Canonical
Để chặn việc lập chỉ mục nội dung trang web nội bộ trùng lặp hoặc trùng lặp ít và các yếu tố có vấn đề khác. Đối với cách khắc phục, bạn có thể sử dụng kĩ thuật noindex và thẻ Canonical.
Cải thiện content kém chất lượng và content mỏng
Google Panda luôn liên tục hoạt động và tiến hành loại bỏ từng chút một những website bị thin content hoặc kém chất lượng.
Thông thường, Panda đánh giá chất lượng cho toàn bộ trang web bằng cách xem xét một số lượng lớn các trang trong đó. Sau đó, nó sẽ điều chỉnh thứ hạng cho phù hợp.
Ngoài ra, Panda còn chấm điểm thứ hạng website theo nội dung trong từng URL và chất lượng của tất cả các URL. Do vậy cốt lõi của vấn đề chính là việc cải thiện nội dung chất lượng content của web.
Loại bỏ content kém chất lượng và content mỏng
Xóa bỏ content kém chất lượng khỏi website không chỉ nhằm mục đích SEO mà còn vì lợi ích của người dùng. Việc đầu tiên, bạn cần chắt lọc ra các phần nội dung kém chất lượng. Và khi bạn tìm thấy phần nội dung kém chất lượng trên một URL đã bị Panda phạt, tôi gợi ý cách giải quyết bằng cách áp dụng:
Chiến lược “Giữ – Bỏ”.
Nếu có thể cải thiện phần content trong website của bạn thì nên làm ngay. Nếu content đó đã quá tốt, bạn không thể cải thiện hơn nữa và người dùng không phàn nàn gì khi họ truy cập vào thì hãy để noindex nó.
Đối với các content đã được Add URL vào Google, việc duy trì chất lượng nội dung ở mức cao nhất (thậm chí phải cao hơn đối thủ) là cực kỳ quan trọng. Việc này có thể giúp website của bạn thoát khỏi các thuật toán kiểm tra chất lượng của Google, trong đó có Panda.
Chiến lược giữ – bỏ không chỉ loại đi phần nội dung kém chất lượng, mà còn giúp người dùng dễ dàng tìm được những gì họ đang cần, đảm bảo content đạt hiệu quả cao. Hơn hết là đáp ứng đủ hoặc có khi hơn cả mong đợi của người dùng. Đồng thời, đảm bảo Google sẽ chỉ index những phần nội dung giá trị nhất của bạn.
Nâng cao chất lượng tổng thể website
Không bao giờ dừng lại ở việc loại bỏ các content kém chất lượng. Mà còn phải xây dựng kế hoạch khắc phục toàn bộ nội dung, bao gồm:
- Nâng cao chất lượng nội dung.
- Cải thiện các yếu tố trải nghiệm người dùng (UX) khác như cắt giảm banner quảng cáo vô nghĩa, form gây rối mắt…
Vì vậy, tôi không cho rằng chỉ loại bỏ mỗi phần nội dung kém chất lượng thôi sẽ mang lại những cải thiện. Cái chính là còn phải tập trung nâng cao chất lượng tổng thể của nó.
Trong quá trình làm SEO, để tránh các hình phạt Google, đặc biệt là vấn đề copy bài viết, bạn có thể nhờ đến sự hỗ trợ của nhiều công cụ kiểm tra.
Copy scape – Công cụ cần thiết để đánh giá chất lượng nội dung bài viết
Copy scape là công cụ trả phí. Nó giúp bạn theo dõi những nội dung bạn đã copy từ trang khác hoặc nội dung nào trên trang bạn đang bị trang khác copy. Chú ý cột Risk bài viết nào có màu càng đậm thì chứng tỏ đó đó là những bài viết bị copy nhiều nhất.
Nên tập trung sửa chữa những trang bị đánh giá màu đậm, độ rủi ro Panda phạt cao.