Google搜尋更人性,動態網頁如Facebook看得懂

經由一支虛擬的機器人大軍—「網路爬行應用程式(Web-crawling applications)」對網站內容所進行的搜尋,Google即可從中將蒐獲的網站資訊臚列到搜尋引擎索引中。但在過去,Google的機器人每逢JavaScript語言所載入的互動式內容就會碰壁,尤其是Asynchronous JavaScript and XML (AJAX)結構的網頁─讓使用者不必重新載入頁面的情況下,即可存取更多的內容的技術。而今,根據位於溫哥華的開發商Alex Pankratov表示,Google的機器人在挖掘互動式網站內容時,似乎被訓練得更具人味,在執行JavaScript的網頁上進行搜尋時,也就無往不利。
Google在往昔也曾提出建議方案,讓AJAX的內容更容易搜尋,如此一來,重擔卻落在網頁開發者,而非Google機器人的身上,也因此並未獲得Google預期的開發者注意。在2011年的最後一季,Google終於開始想出,如何從其終端有效的解決此一問題,並開始推出機器人,讓它經由尋遍內頁的JavaScript,並找出其中的網址,將其加入到搜尋內容這種方式,能夠探索到網頁的動態內容。這種做法在某些情況下(依JavaScript程式碼的撰寫方式而定),需要Google公司同意它的搜尋者發送網路伺服器所需的POST表單(POST requests,通常用來處理較大資料的傳送方式)給網站,而非GET表單(GET requests,較小資料的傳送方式),後者多是用來接收內容。總之,Google已經可以開始檢索類似Facebook上面的回應,以及其他「動態回應」系統。
爾今,根據Pankratov日誌顯示,機器人顯然已非單純在JavaScript上挖掘網址,它們甚至已經深入超過「回應」層次,將JavaScript功能的處理方式更上層樓。在使用者點選可以動作的物件時,Google搜尋亦可輕鬆進入網路內部,檢索躲藏在資料庫內的內容及其他訊息來源,這些都是以往無法做到的事情。
來源:arstechnica