搜索引擎到底會(huì )不會(huì )抓取圖片、js、fhash內容?
來(lái)源:昆明多彩網(wǎng)絡(luò )公司 日期:2010-08-18 閱讀: 發(fā)表評論
網(wǎng)頁(yè)組成內容無(wú)非就是文字,圖片,js,動(dòng)畫(huà)flash,視頻元素,早在幾年前,在搜索引擎發(fā)展初級階段的時(shí)候,搜索引擎的抓取內容方式是及其原始和簡(jiǎn)陋的,而且只能抓取網(wǎng)頁(yè)的title等頁(yè)頭部分。
當時(shí)站長(cháng)群也很少,而且做一個(gè)關(guān)鍵詞也非常容易,主要隨便修改一下網(wǎng)頁(yè)的標題就可以達到很好的排名,隨著(zhù)搜索引擎數據發(fā)掘技術(shù)的發(fā)展,搜索引擎慢慢會(huì )嘗試去抓取更多的東西,比如網(wǎng)頁(yè)的其他文字內容,并且不再將網(wǎng)頁(yè)標題作為唯一的排名標準,并且加入了很多其他的算法來(lái)給一個(gè)網(wǎng)站在搜索引擎上綜合的排名。
目前來(lái)說(shuō),百度能夠很好的識別和把握中文內容,不然也不會(huì )對外號稱(chēng)自己是全球第一大中文搜索引擎,對圖片能夠有一定程度的識別,而對flash動(dòng)畫(huà)和視頻抓取技術(shù)還比不上google;谷歌雖然不主張站長(cháng)使用動(dòng)畫(huà)來(lái)作為網(wǎng)站主要展示內容的方式,但是經(jīng)過(guò)大家試驗,一些簡(jiǎn)單的flash動(dòng)畫(huà)內的問(wèn)題google能夠很好的識別,并將該元素內抓取的內容作為網(wǎng)站綜合排名的依據,而百度似乎還是停留在文字和圖片基礎上。
谷歌對于一些單色背景圖片能夠很好的識別,比如黑色背景上打上白色的字,谷歌的識別幾乎達到了100%。
發(fā)表評論評論列表(有 條評論)