0
Google Spider  là các "con bọ tìm kiếm ". Nó được tự động sinh ra từ các máy chủ của Google. Chúng có nhiệm  vụ săn tìm, truy lùng các dữ liệutrên các website dựa trên các đường liên kết (link). Google spider hoạt  động chủ yếu dựa vào liên kết (link) trên các pages, website và dựa vào hành vi người dùng hoặc truy vấn của trình duyệt tác động lên 1 page, website nào đó để lập chỉ mục cho page, website đó hiển thị trên công cụ tìm kiếm Google.
Google spider được phân chia đơn giản hơn thành 2 loại: spider chủ động và spider thụ động.
-Spider chủ động:
Google spider chủ động hoạt động dựa trên các liên kết trong một trang hay cả website. Đối với loại spider này yếu tố ảnh hưởng nhất là "SiteMap" do đó các SEOER thường tạo sitemap (.xml) cho website và submit lên công cụ webmaster tools cho chúng làm việc tốt hơn, website được thu thập dữliệu tốt hơn ! Chúng tự động thu thập dữ liệu và phân tích, đi theo các đường dẫn ( link ) để tiếp tục công việc của mình.
-Spider thụ động:
Google spider thụ động hoạt động dựa trên sự truy vấn của trình duyệt vào 1 website, page nào đó.Tức là nếu có 1 website mà bạn không làm gì mà chỉ truy cập thông qua các trình duyệt web như: IE, Frifox, google Chrome...thì website của bạn cũng sẽ được lập chỉ mục, nhưng thời gian sẽ vô cùng chậm tức là website sẽ lâu được Index. Loại spider này có thể tác động qua cả ứng dụng Google plus ( G+ ) khi người dùng click G+ để +1 cho page nào đó thì ngay lập tức spider này sinh ra và đi tới page đó để tiến hành công việc. Để website được index nhanh, uy tín hơn thì các SEOER phải điều hướng được Spider để nó ghé thăm website của mình nhiều hơn.
Cách điều hướng Spider
-Điều hướng 1: Đầu tiên khi vào Site của bạn Spidersẽ tìm  đến file: Robot.txt sau đó là file
Sitemap. Do đó trên mọi website 2 file này không được thiếu.
-Điều hướng thứ 2: Xấy dựng các liên kết nội bội để điều hướng Spide từ Pages này sang Pages khác trên cùng 1 website.
-Điều hướng thứ 3: sử dụng thuộc tính Alow/Disallow trong file Robot.txt để điều hướng spider tập trung index các phần dữ  liệu quan trọng, chặn các đường link xấu, các đường link không quan trọng.

Post a Comment

 
Top