Cuộc chiến Rank website và thuật toán của Google

admin Apr 21, 2011 0

Sự thông minh của máy tính giống như một bài toán đố. Chúng đôi khi thực sự thông thái, nhưng có lúc lại hoàn toàn ngớ ngẩn.

Ảnh: Blogote.

Ảnh: Blogote.

Theo The New York Times, cuối tháng 2, Google tuyên bố cải tổ công thức xếp hạng website, theo đó những trang có “chất lượng thấp” sẽ bị giáng cấp. Google không nêu đích danh những site này, nhưng các chuyên gia phân tích tin rằng đó là những website chuyên tập hợp thông tin từ những nguồn khác, chứa những từ khóa thường xuyên được người sử dụng nhập vào công cụ tìm kiếm nhằm lôi kéo lượng truy cập từ Google và thu hút nguồn quảng cáo.

Essortment, một trong những site như thế, đã bị tụt hạng đáng kể sau khi Google thay đổi thuật toán. Một bài viết điển hình trên trang này: “25 điều thú vị để làm cùng bạn gái“, bao gồm các từ khóa phổ thông trên Google Search như “nấu ăn”, “chạy”, “cắm trại”, “mua sắm”. Ngoài ra, nó cũng chứa những “thỏi nam châm” thu hút sự chú ý như “bạn gái”, “hẹn hò”, “hôn nhân” và “độc thân”. Và trang chứa bài viết “25 điều thú vị” này tràn ngập quảng cáo.

Động thái mới của Google cũng ảnh hưởng đến nhiều công ty hoạt động trong lĩnh vực SEO (tối ưu công cụ tìm kiếm). Chẳng hạn, công ty Mahalo thừa nhận họ đã đầu tư hàng triệu USD xây dựng những dự án “spam”, tạo hàng trăm trang có chủ đề giống nhau nhằm tăng thứ hạng cho website của khách hàng. Tuy nhiên, thay đổi của Google khiến chiến lược của họ chệch hướng và ảnh hưởng nghiêm trọng tới nguồn thu.

Vấn đề đặt ra với chủ sở hữu website hiện nay là cần hiểu Google coi một trang như thế nào là “chất lượng thấp”, họ phải làm gì để công cụ tìm kiếm của Google đánh giá cao và Google sẽ còn xây dựng thuật toán gì trong tương lai khi đánh giá và xếp hạng một trang web.

Máy tính chỉ thông minh nhờ thuật toán – những phần mềm do chính con người viết ra. Khi chạy trên một cỗ máy siêu mạnh, một thuật toán thông minh có thể làm nên những chiến công đáng kinh ngạc, như thuật toán của Google có thể xử lý 1 tỷ câu lệnh tìm kiếm mỗi ngày.

Tuy nhiên, máy tính không phải con người. Chúng không có kiến thức nền, có sắc thái và sự nhạy cảm. Chúng thông minh dựa trên những tác vụ được lập trình sẵn như chơi cờ, quét thông tin. Giữa tháng 2, máy tính Watson của IBM đã đánh bại 2 người chơi xuất sắc của chương trình đố vui Jeopardy. Nhưng trong quá trình đến vinh quang, Watson đôi khi vẫn đưa ra những đáp án ngớ ngẩn đến mức khán giả phải bật cười và lắc đầu.

“Để máy tính hiểu ngôn ngữ như một đứa trẻ lên 8 khó hơn nhiều so với việc đánh bại một bậc thầy về cờ vua”, Oren Etzioni, nhà khoa học tại Đại học Washington (Mỹ), nhận định.

Máy tính không thể thực sự hiểu các từ ngữ. Thay vào đó, thuật toán của nó quét qua hàng núi văn bản để tính toán tần suất xuất hiện của các từ khóa. Do đó, một trang web có nội dung dở nhưng được “cày cấy” nhiều từ khóa phổ biến sẽ vẫn có thể đứng đầu kết quả tìm kiếm – mục tiêu hàng đầu của các website, nhất là trong lĩnh vực tin tức và thương mại điện tử.

Google thường xuyên chỉnh sửa thuật toán nhưng hiếm khi thực hiện đợt cải tổ lớn như vừa rồi. Giới quan sát cho rằng trong tương lai, thứ hạng website sẽ được nhìn nhận theo cách khác khi Google hay Microsoft Bing trở thành cỗ máy trả lời như Watson. Chẳng hạn, người sử dụng hỏi: “Tòa nhà Bitexco Finacial Tower có bao nhiêu tầng” và kết quả họ nhận được không phải là các đường link mà là câu trả lời “68 tầng”.

Đăng Bình Luận »