Google Search Hoạt Động Như Thế Nào ? |
Tổng quan về Google Search
Google Search – công cụ tìm kiếm thông tin của tập đoàn Google đã từ lâu trở thành một công cụ tiên phong trong lĩnh vực tìm kiếm thông tin Online. Đây là sản phẩm đầu tiên và cũng mang lại nhiều thành công nhất cho tập đoàn này. Không chỉ nổi trội về tốc độ tìm kiếm, kết quả tìm kiếm của Google cũng thực sự chất lượng, đem đến cho người dùng những thông tin mà họ thực sự cần nhất.
Google Search là một công cụ ảnh hưởng rất lớn và trực tiếp đến với ngành dịch vụ SEO bởi hơn 90% cá SEOer chỉ thực hiện công việc SEO trên Google. Như vậy, việc tìm hiểu quy trình tìm kiếm thông tin của Google là vô cùng cần thiết đối với bất cứ SEOer hay nhà quản lý SEO nào. Tuy nhiên, không phải ai cũng thực sự hiểu được quy trình tìm kiếm của Google. Bài viết này sẽ giúp các nhà đầu tư SEO có một cái nhìn bản chất về quá trình hoạt động của Google Search.
Có phải Google Search trực tiếp dò tìm thông tin qua mạng lưới các website?
Trước khi đi vào tìm hiểu quy trình hoạt động của Google Search, đầu tiên chúng ta cần làm rõ lại bản chất việc tìm kiếm thông tin của người dùng mạng. Mỗi khi chúng ta – những người dùng của Google Search, gõ một từ khóa (keywords) lên thanh công cụ tìm kiếm một từ khóa, tức là chúng ta đang tìm kiếm những thông tin liên quan đến từ khóa đó trong bộ lưu dữ liệu website của Google.
Đa phần tất cả người dùng đều đang lầm tưởng rằng chúng ta tìm kiếm thông tin trực tiếp trong mạng Internet, tuy nhiên, những kết quả chúng ta thu được đó chỉ là bản lưu hay bản chỉ mục của Google về những website mà Googlebot đã index qua. Như vậy, bản chất của Google Search là một bộ máy thu thập dữ liệu của tất cả website trên thế giới về ngân hàng dữ liệu của nó, và sau đó chọn lọc những thông tin mà cỗ máy tìm kiếm này cảm thấy phù hợp với người dùng.
Quy trình hoạt động của Google Search
Vậy thì Google Search hoạt động như thế nào? Quy trình hoạt động của công cụ tìm kiếm này bao gồm 3 bước chính sau:
Index websites – Google Search
Quá trình Index websites, hay còn gọi là Google Indexing là quá trình thu thập thông tin của website. Google thực hiện công đoạn này với một phần mềm thu thập dữ liệu với tên gọi là Googlebot. Chương trình thu thập dữ liệu này bắt đầu công việc của nó với việc tìm nạp một số website, thu thập tất cả thông tin, nội dung và cũng theo dõi liên kết trên trang đó và tiếp tục tìm nạp các trang mà website đó có link trỏ tới và theo dõi tất cả. Quá trình tìm nạp các trang vẫn tiếp tục cho đến khi toàn bộ các đường link liên quan được lập chỉ mục hết.
Như vậy sẽ có thể có hàng tỷ website được Google index chỉ từ một trang bắt đầu. Và quá trình Googlebot rà soát thông và lưu tin trên trang được gọi là crawl dữ liệu.
Lưu dữ liệu – Google Search
Các thông tin và liên kết của website mà Googlebot thu thập được sẽ được lưu trữ dưới dạng văn bản (text) và đánh chỉ mục chúng. Sau đó, lưu lại trong ngân hàng dữ liệu của Google. Như vậy, thông tin về website đã được thu gọn lại nhằm mục đích truy xuất thông tin. Tuy nhiên, Google sẽ không lưu được hình ảnh hay các plug-in có trong trang web hay những media không thuộc dạng văn bản.
Chiết xuất thông tin – Google Search
Khi người dùng gõ một từ khóa vào thanh công cụ tìm kiếm của Google, phần mềm tìm kiếm thông tin của Google sẽ tìm kiếm thông tin qua các chỉ mục đã lưu trong ngân hàng dữ liệu. Thông qua hơn 200 các tiêu chí đánh giá thông tin trang web đã lưu để quyết định tài liệu nào mà người dùng đang thực sự muốn tìm. Sau đó, chiết xuất kết quả tìm kiếm dưới dạng bảng xếp hạng và gửi lại cho người dùng. Như vậy, kết quả tìm kiếm từ công cụ này về bản chất đều là công cụ tìm kiếm tự nhiên, ít có sự can thiệp của bàn tay con người.
Bạn có thể tham khảo thêm về cơ chế hoạt động của Google tại trang web sau của Google:
http://www.google.com/insidesearch/howsearchworks/thestory/
Video của Matt Cutts – trưởng nhóm Google Webspam, giới thiệu về quá trình tìm kiếm và xử lý thông tin của Google Search.
Cùng Chuyên Mục
0 nhận xét:
Đăng nhận xét