Nạn blog 'rác' xuất hiện nhằm tăng thứ hạng website

Thảm họa spam đã tự biến hóa chính nó cho phù hợp với thế giới website cá nhân, và được các chuyên gia gán cho tên gọi "splog" (blog giả). Cuối tuần qua, Google chính là tấm bia đỡ đạn của cuộc tấn công kiểu này.

Chương trình Blogger và Blogspot, hai dịch vụ blog miễn phí phổ biến nhất hiện nay của hãng tìm kiếm, đã bị kẻ tấn công lợi dụng và thực hiện vụ "spam blog" lớn nhất từ trước đến nay. Nó cản trở hoạt động của bộ đọc tin RSS reader, làm ngập lụt và có khả năng đã phần nào điều chỉnh được hệ thống xếp hạng (rank) của công cụ tìm kiếm.

Kẻ tấn công, tạm gọi là splogger, xử lý một đoạn script để dò tự động những từ khóa nhất định, thường là tên những blogger nổi tiếng, trên công cụ tìm kiếm web cá nhân. Sau đó, chúng đưa kết quả vào Blogger và BlogSpot, sử dụng giao diện lập trình ứng dụng của dịch vụ (API) và tự động tạo hàng chục nghìn blog chứa nội dung từ trang web thật của blogger và vô số đường link tới những site về thế chấp nhà cửa, đánh bài và kinh doanh thuốc lá... Hành động này nhằm mục đích quảng cáo hoặc tăng số rank trong kết quả tìm kiếm.

Khi mọi người gõ tên vào công cụ search hoặc sử dụng chương trình như PubSub, Technorati và Feedster để tự động theo dõi các bài viết của một blogger nổi tiếng nào đó, RSS reader của họ sẽ bị ngập lụt bởi những đường kết nối vô nghĩa. Splog còn tìm đường thâm nhập vào cả hệ thống thông báo e-mail mới.

"Hỡi các cư dân lãnh địa blog, tôi nghĩ chúng ta đang ở trong tình trạng khẩn cấp", Tim Bray, Giám đốc công nghệ web của Sun Microsystems, viết trên trang cá nhân của ông. "Số lượng site giả nhiều đến mức không thể tin được. Phần mềm giúp âm mưu này thành công phải rất tinh xảo và khi mới nhìn bạn sẽ nghĩ blog giả đó là trang thực".

Khác với chương trình e-mail, dịch vụ blog hiện không có khả năng đề phòng và lọc spam. Dù không ước tính được quy mô của sự kiện cuối tuần qua, Bob Wyman, Giám đốc công nghệ dịch vụ tìm kiếm web cá nhân Pubsub, cho biết số RSS feed mà dịch vụ của ông gửi tới người đăng ký đã tăng gấp đôi trong suốt vụ tấn công, tức khoảng 6 triệu/ngày. Trang Technorati ước tính khoảng 5,8% blog mới là giả. Google cũng khẳng định họ đã xóa 13.000 splog trong suốt 2 ngày cuối tuần.

Jason Goldman, Giám đốc sản xuất Blogger, cho biết Google đang tập trung giải quyết vấn đề splog như xây dựng chương trình để người dùng thông báo về những site có dấu hiệu đáng ngờ hoặc yêu cầu người tạo web gõ thủ công một số từ nhất định để xác nhận blog được xây dựng bởi một người thực chứ không phải hệ thống tự động.

Spam blog, viết tắt là splog, là những trang blog giả mà người tạo ra chúng chỉ sử dụng để khuếch trương tăng chỉ số xếp hạng cho một số website nhất định. Nội dung của splog thường vô nghĩa hoặc lấy cắp thông tin từ những trang web cá nhân khác, cùng với số link nhiều đến bất thường, đưa người xem tới những site có liên quan nào đó tới kẻ tạo splog.

Thuật ngữ splog bắt đầu được nhiều người biết đến vào khoảng giữa tháng 8/2005 khi nó được một số blogger nổi tiếng sử dụng. Tuy nhiên, từ này đã xuất hiện rải rác trên một số trang web trước đây, ít nhất là từ năm 2003 (Wikipedia).