Search Engine – Công Cụ Tìm Kiếm Là Gì? |
Search Engine là gì? – Công cụ tìm kiếm là gì?
Ra đời đầu tiên vào năm 1993, đến nay, Search Engine đã trở thành một phần không thể thiếu của cuộc sống, và không ngừng được cải thiện về số lượng và chất lượng các kết quả tìm kiếm. Sự phát triển của Search Engine được gắn liền với sự phát triển của công nghệ thông tin toàn cầu, và đặc biệt gắn liền với sự thay đổi của ngành dịch vụ SEO.
Search Engine (tên đầy đủ là Web Search Engine) – Công cụ tìm kiếm là một loại hệ điều hành được thiết kế với chức năng tìm kiếm các thông tin trên mạng World Wide Web. Khi người dùng sử dụng công cụ tìm kiếm, họ sẽ cần phải nhập một từ khóa (keyword) của chủ đề mình cần tìm hiểu để có thể nhận về một bảng kết quả có chức các trang web, hình ảnh. video, địa chỉ bản đồ (đối với tên địa danh) hoặc các loại files tài liệu,… có liên quan đến chủ đề tìm kiếm đó.
Các kết quả trả về này sẽ được sắp xếp theo một thứ tự nhất định bằng các thuật toán tìm kiếm của Search Engine, và tùy vào mỗi Search Engine mà chúng ta tại có một thuật toán tìm kiếm khác nhau. Do không hề được can thiệp bởi con người, nên các kết quả trả về này còn được gọi là kết quả tìm kiếm tự nhiên (Organic Search Traffic).
Thị phần sử dụng công cụ tìm kiếm
Hiện nay, Search Engine là một mảng thị phần cạnh tranh rất gay gắt trên toàn cầu, với ngôi đầu bảng tạm thời rơi vào tay Google Search, với thị phần người dùng trung bình trên toàn cầu rơi vào khoảng trên 70%. Cụ thể:
Tuy nhiên, tại Nga và một số các quốc gia Đông Á, Google lại để mất vị thế dẫn đầu của mình vào tay các đối thủ khác. Cụ thể, Yandex là công cụ tìm kiếm được sử dụng nhiều nhất tại Nga với 61,9% thị phần tìm kiếm. Tại Trung Quốc. Baidu là công cụ tìm kiếm phổ biến nhất, Naver tại Hàn Quốc và Yahoo! Japan và Yahoo! Taiwan tại Nhật Bản và Đài Loan. (nguồn: wikipedia.com)
Việt Nam là một trường hợp khá đặc biệt khác. Tại Việt Nam, Cốc Cốc là công cụ tìm kiếm có lượng người truy cập hàng tháng và hàng ngày nhiều nhất. Tuy nhiên, các kết quả tìm kiếm trả về trên công cụ tìm kiếm này phần lớn được thực hiện bởi Google Search. Vì vậy, trên lý thuyết, Google Search sẽ là công cụ tìm kiếm được sử dụng nhiều nhất tại Việt Nam hiện nay.
Hiện nay, Search Engine thường được cấu tạo bởi 3 bộ phận chính, nhằm giảm thiểu tối đa thời gian tìm kiếm thông tin cho người dùng. Cụ thể:
• Spider (hay còn được gọi là “Crawler” hay “Bot“) là một công cụ giúp Search Engine thu thập dữ liệu của một trang web bất kỳ nào đó, bao gồm dữ liệu thông tin về nội dung trên trang, số lượng và tần suất liên kết của các trang web khác đến trang đó. Việc thu thập dữ liệu của Spidersẽ được thực hiện không ngừng từ một website bất kỳ nào đó và chỉ kết thúc khi tất cả các liên kết có liên quan được thu thập dữ liệu hết.
Các thông tin về những liên kết đến và đi khỏi website (internal link & external link) sẽ được gắn liền với website, để giúp công cụ tìm kiếm có thể đánh giá độ phổ biến và uy tín của website (Domain authority & Domain popularity). Như vậy, từ một trang ban đầu, Spider có thể đã thu thập dữ liệu của hàng triệu các website khác, đảm bảo tất cả các website đều có thể
được thu thập dữ liệu và được đánh giá một cách chính xác nhất.
• Công cụ lập chỉ mục – Index: là công cụ thực hiện việc lưu một cách tối ưu toàn bộ dữ liệu đã thu thập của một trang web, bao gồm nội dung và các liên kết đến và đi trên trang. Các dữ liệu này sẽ được mã hóa dưới dạng file text (văn bản) để có thể lưu lại với dung lượng thấp nhất và trích xuất kết quả tìm kiếm được nhanh nhất. Dữ liệu sau khi được mã hóa sẽ được phân tích và lập chỉ mục lưu lại trong bộ cơ sở dữ liệu gốc, giúp cho Search Engine không phải tìm thông tin trên từng website mỗi khi có người dùng tìm kiếm từ khóa, giảm thiểu tối đa thời gian trả về kết quả tìm kiếm cho người dùng.
• Công cụ trích xuất kết quả tìm kiếm: Khi có một tìm kiếm của người dùng được gởi đến cho Search Engine, từ khóa đó sẽ phải đi qua các bộ lọc truy vấn nhằm giúp công cụ tìm kiếm đánh giá rõ hơn về thông tin tìm kiếm và thông tin của người dùng. Từ đó, tìm kiếm và trích xuất các thông tin từ những dữ liệu đã được index sao cho phù hợp với truy vấn của người dùng nhất. Như vậy, về bản chất, mỗi khi người dùng tìm kiếm thông tin trên mạng, họ chỉ đang tìm kiếm thông tin trên những bản lưu website mà Search Engine đã lưu trước đó.
• Bảng kết quả tìm kiếm(SERP): Kết quả tìm kiếm của Google sau khi được Công cụ trích xuất kết quả tìm kiếm xử lý và xếp hạng kết quả tìm kiếm, sẽ được hiển thị trên một bảng kết quả như chúng ta vẫn thấy khi sử dụng Google.
(Tìm hiểu thêm về cách hoạt động của một công cụ tìm kiếm tiêu biểu: Google Search tại bài viết: Google Search hoạt động như thế nào?)
Hiện nay, Search Engine là một lĩnh vực khá độc quyền, với việc top 4 các công cụ tìm kiếm hiện nay chiếm trên 97% thị phần người dùng trên toàn thế giới, bao gồm: Google Search, Yahoo! Search, Bing Search và Baidu Seacrh. Cụ thể:
Khái niệm Search Engine – Công cụ tìm kiếm
Search Engine (tên đầy đủ là Web Search Engine) – Công cụ tìm kiếm là một loại hệ điều hành được thiết kế với chức năng tìm kiếm các thông tin trên mạng World Wide Web. Khi người dùng sử dụng công cụ tìm kiếm, họ sẽ cần phải nhập một từ khóa (keyword) của chủ đề mình cần tìm hiểu để có thể nhận về một bảng kết quả có chức các trang web, hình ảnh. video, địa chỉ bản đồ (đối với tên địa danh) hoặc các loại files tài liệu,… có liên quan đến chủ đề tìm kiếm đó.
Các kết quả trả về này sẽ được sắp xếp theo một thứ tự nhất định bằng các thuật toán tìm kiếm của Search Engine, và tùy vào mỗi Search Engine mà chúng ta tại có một thuật toán tìm kiếm khác nhau. Do không hề được can thiệp bởi con người, nên các kết quả trả về này còn được gọi là kết quả tìm kiếm tự nhiên (Organic Search Traffic).
Thị phần sử dụng công cụ tìm kiếm
Hiện nay, Search Engine là một mảng thị phần cạnh tranh rất gay gắt trên toàn cầu, với ngôi đầu bảng tạm thời rơi vào tay Google Search, với thị phần người dùng trung bình trên toàn cầu rơi vào khoảng trên 70%. Cụ thể:
Thị phần tìm kiếm trên toàn cầu của Search Engine năm 2014
Tuy nhiên, tại Nga và một số các quốc gia Đông Á, Google lại để mất vị thế dẫn đầu của mình vào tay các đối thủ khác. Cụ thể, Yandex là công cụ tìm kiếm được sử dụng nhiều nhất tại Nga với 61,9% thị phần tìm kiếm. Tại Trung Quốc. Baidu là công cụ tìm kiếm phổ biến nhất, Naver tại Hàn Quốc và Yahoo! Japan và Yahoo! Taiwan tại Nhật Bản và Đài Loan. (nguồn: wikipedia.com)
Việt Nam là một trường hợp khá đặc biệt khác. Tại Việt Nam, Cốc Cốc là công cụ tìm kiếm có lượng người truy cập hàng tháng và hàng ngày nhiều nhất. Tuy nhiên, các kết quả tìm kiếm trả về trên công cụ tìm kiếm này phần lớn được thực hiện bởi Google Search. Vì vậy, trên lý thuyết, Google Search sẽ là công cụ tìm kiếm được sử dụng nhiều nhất tại Việt Nam hiện nay.
Cấu tạo của Search Engine
Hiện nay, Search Engine thường được cấu tạo bởi 3 bộ phận chính, nhằm giảm thiểu tối đa thời gian tìm kiếm thông tin cho người dùng. Cụ thể:
• Spider (hay còn được gọi là “Crawler” hay “Bot“) là một công cụ giúp Search Engine thu thập dữ liệu của một trang web bất kỳ nào đó, bao gồm dữ liệu thông tin về nội dung trên trang, số lượng và tần suất liên kết của các trang web khác đến trang đó. Việc thu thập dữ liệu của Spidersẽ được thực hiện không ngừng từ một website bất kỳ nào đó và chỉ kết thúc khi tất cả các liên kết có liên quan được thu thập dữ liệu hết.
Các thông tin về những liên kết đến và đi khỏi website (internal link & external link) sẽ được gắn liền với website, để giúp công cụ tìm kiếm có thể đánh giá độ phổ biến và uy tín của website (Domain authority & Domain popularity). Như vậy, từ một trang ban đầu, Spider có thể đã thu thập dữ liệu của hàng triệu các website khác, đảm bảo tất cả các website đều có thể
được thu thập dữ liệu và được đánh giá một cách chính xác nhất.
• Công cụ lập chỉ mục – Index: là công cụ thực hiện việc lưu một cách tối ưu toàn bộ dữ liệu đã thu thập của một trang web, bao gồm nội dung và các liên kết đến và đi trên trang. Các dữ liệu này sẽ được mã hóa dưới dạng file text (văn bản) để có thể lưu lại với dung lượng thấp nhất và trích xuất kết quả tìm kiếm được nhanh nhất. Dữ liệu sau khi được mã hóa sẽ được phân tích và lập chỉ mục lưu lại trong bộ cơ sở dữ liệu gốc, giúp cho Search Engine không phải tìm thông tin trên từng website mỗi khi có người dùng tìm kiếm từ khóa, giảm thiểu tối đa thời gian trả về kết quả tìm kiếm cho người dùng.
• Công cụ trích xuất kết quả tìm kiếm: Khi có một tìm kiếm của người dùng được gởi đến cho Search Engine, từ khóa đó sẽ phải đi qua các bộ lọc truy vấn nhằm giúp công cụ tìm kiếm đánh giá rõ hơn về thông tin tìm kiếm và thông tin của người dùng. Từ đó, tìm kiếm và trích xuất các thông tin từ những dữ liệu đã được index sao cho phù hợp với truy vấn của người dùng nhất. Như vậy, về bản chất, mỗi khi người dùng tìm kiếm thông tin trên mạng, họ chỉ đang tìm kiếm thông tin trên những bản lưu website mà Search Engine đã lưu trước đó.
• Bảng kết quả tìm kiếm(SERP): Kết quả tìm kiếm của Google sau khi được Công cụ trích xuất kết quả tìm kiếm xử lý và xếp hạng kết quả tìm kiếm, sẽ được hiển thị trên một bảng kết quả như chúng ta vẫn thấy khi sử dụng Google.
(Tìm hiểu thêm về cách hoạt động của một công cụ tìm kiếm tiêu biểu: Google Search tại bài viết: Google Search hoạt động như thế nào?)
Các Search Engine hàng đầu hiện nay
Hiện nay, Search Engine là một lĩnh vực khá độc quyền, với việc top 4 các công cụ tìm kiếm hiện nay chiếm trên 97% thị phần người dùng trên toàn thế giới, bao gồm: Google Search, Yahoo! Search, Bing Search và Baidu Seacrh. Cụ thể:
Google Search
Google Search, hay còn được gọi là Google Web Search hay ngắn gọn là Google, là một công cụ tìm kiếm thông tin Online thuộc sở hữu bởi tập đoàn Google, là một trong những Search Engine được sử dụng phổ biến nhất hiện nay trên thế giới, với hơn 3 tỷ lượt tìm kiếm mỗi ngày. Được phát triển từ năm 1997 bởi Larry Page và Sergey Brin, đến năm 1998, Google đã chính thức ra mắt công cụ tìm kiếm của mình.
Đến nay, sau nhiều năm liên tục được cập nhật và phát triển, với hàng tỷ dữ liệu được lưu trữ, tốc độ tìm kiếm ưu việt hàng đầu và luôn đi tiên phong trong việc tạo và cập nhật các thuật toán chống spam, giúp đem lại trải nghiệm tốt nhất cho người dùng.
Yahoo! Search
Yahoo Search là công cụ tìm kiếm website trực thuộc sở hữu của tập đoàn Yahoo!. Đây là công cụ tìm kiếm lớn thứ ba tại Mỹ tính đến tháng 2 năm 2015, với lượng truy vấn tìm kiếm đạt 12,8%. Mặc dù được thành lập từ năm 1995, nhưng phải đến 2004, Yahoo! mới chính thức trình làng sản phẩm Search Engine của mình. Mặc dù được ra đời sau, nhưng do lợi thế về thị phần người sử dụng Yahoo! Messenger và Yahoo! Mail khá lớn. Yahoo Search vẫn cạnh tranh khá tốt với các đối thủ đi trước mình cả nửa thập niên.
Trước sự cạnh tranh quá khốc nghiệt với Google Search, năm 2009, Yahoo và Microsoft đã quyết định đi đến một sự thỏa thuận hợp tác cùng phát triển Bing Yahoo Search.
Bing Search
Bing Search, tiền thân là MSN Search (trước đó còn gọi với tên là Live Search, Windows Live Search) là một công cụ tìm kiếm của tập đoàn Microsoft. Công cụ tìm kiếm Bing lần đầu tiên được ra mắt vào 28 tháng 5 2009, và trở thành công cụ tìm kiếm lớn thứ hai tại thị trường Bắc Mỹ.
Ngày 29 tháng bảy năm 2009, Microsoft và Yahoo! đã đi đến một thỏa thuận mười năm với nội dung sẽ Yahoo! Search sẽ được thay thế bởi Bing Search. Yahoo! sẽ nhận được để giữ 88% doanh thu từ tất cả các doanh quảng cáo tìm kiếm trên trang web của mình trong năm năm đầu tiên của thỏa thuận, và có quyền để bán quảng cáo trên một số trang web của Microsoft.
Google Search, hay còn được gọi là Google Web Search hay ngắn gọn là Google, là một công cụ tìm kiếm thông tin Online thuộc sở hữu bởi tập đoàn Google, là một trong những Search Engine được sử dụng phổ biến nhất hiện nay trên thế giới, với hơn 3 tỷ lượt tìm kiếm mỗi ngày. Được phát triển từ năm 1997 bởi Larry Page và Sergey Brin, đến năm 1998, Google đã chính thức ra mắt công cụ tìm kiếm của mình.
Đến nay, sau nhiều năm liên tục được cập nhật và phát triển, với hàng tỷ dữ liệu được lưu trữ, tốc độ tìm kiếm ưu việt hàng đầu và luôn đi tiên phong trong việc tạo và cập nhật các thuật toán chống spam, giúp đem lại trải nghiệm tốt nhất cho người dùng.
Yahoo! Search
Yahoo Search là công cụ tìm kiếm website trực thuộc sở hữu của tập đoàn Yahoo!. Đây là công cụ tìm kiếm lớn thứ ba tại Mỹ tính đến tháng 2 năm 2015, với lượng truy vấn tìm kiếm đạt 12,8%. Mặc dù được thành lập từ năm 1995, nhưng phải đến 2004, Yahoo! mới chính thức trình làng sản phẩm Search Engine của mình. Mặc dù được ra đời sau, nhưng do lợi thế về thị phần người sử dụng Yahoo! Messenger và Yahoo! Mail khá lớn. Yahoo Search vẫn cạnh tranh khá tốt với các đối thủ đi trước mình cả nửa thập niên.
Trước sự cạnh tranh quá khốc nghiệt với Google Search, năm 2009, Yahoo và Microsoft đã quyết định đi đến một sự thỏa thuận hợp tác cùng phát triển Bing Yahoo Search.
Bing Search
Bing Search, tiền thân là MSN Search (trước đó còn gọi với tên là Live Search, Windows Live Search) là một công cụ tìm kiếm của tập đoàn Microsoft. Công cụ tìm kiếm Bing lần đầu tiên được ra mắt vào 28 tháng 5 2009, và trở thành công cụ tìm kiếm lớn thứ hai tại thị trường Bắc Mỹ.
Ngày 29 tháng bảy năm 2009, Microsoft và Yahoo! đã đi đến một thỏa thuận mười năm với nội dung sẽ Yahoo! Search sẽ được thay thế bởi Bing Search. Yahoo! sẽ nhận được để giữ 88% doanh thu từ tất cả các doanh quảng cáo tìm kiếm trên trang web của mình trong năm năm đầu tiên của thỏa thuận, và có quyền để bán quảng cáo trên một số trang web của Microsoft.
Baidu
Baidu là một công cụ tìm kiếm của Trung Quốc thành công nhất cho đến nay, được thiết kế riêng cho người dùng sử dụng Tiếng Trung. Từ khi được ra mắt vào năm 2000, đến nay Baidu đã trở thành công cụ tìm kiếm được sử dụng nhiều thứ 2 thế giới, chỉ sau Google. Để có một thành công như vậy, ngoài việc kế thừa những thành công của những đối thủ đi trước như Google hay Wikipedia, Baidu đã phải có một sự hỗ trợ rất lớn từ chủ nghĩa dân tộc và những hỗ trợ độc quyền của chính phủ của Trung Quốc. Hiện nay, Baidu Search đã trở thành công cụ tìm kiếm không thể thiếu cho những ai sử dụng tiếng Trung và muốn kinh doanh tại thị trường này.
Cùng Chuyên Mục
0 nhận xét:
Đăng nhận xét