搜索算法排名因素統(tǒng)計靠譜嗎
但有一個問題一直沒仔細(xì)說。所有排名因素統(tǒng)計調(diào)查都一樣,嚴(yán)格說,從搜索結(jié)果統(tǒng)計分析出來的排名因素只能說是與排名有相關(guān)性,不一定有因果性。換句話說,觀察、統(tǒng)計得到的排名因素并不一定是真的搜索引擎使用中的排名因素。
簡單說,這些排名因素統(tǒng)計的過程是這樣:搜索典型關(guān)鍵詞(總數(shù)需要達(dá)到一定量,比如1萬個關(guān)鍵詞),下載搜索結(jié)果頁面(比如前2頁或前10頁),使用各種工具記錄、查詢頁面的特征(也就是排名因素),分析排名好的頁面有哪些共同特征,或者有哪些排名不好的頁面所沒有的特征,使用統(tǒng)計方法如皮爾森相關(guān)系數(shù)(Pearson)或斯皮爾曼相關(guān)系數(shù)(Spearman)計算出排名與排名因素之間的相關(guān)系數(shù)。
所以,這種統(tǒng)計的基礎(chǔ)是,“排名好”與“頁面特征”同時出現(xiàn),也就是這兩者有相關(guān)性,經(jīng)常相關(guān)系數(shù)還挺高。但有相關(guān)性并不必然說明有因果性。最淺顯的比喻是,公雞打鳴和天亮經(jīng)常一起出現(xiàn),是有很高相關(guān)性的,而且是公雞打鳴后天亮,但公雞打鳴不是天亮的原因。
排名與所謂的排名因素之間也是如此。最明顯的,幾乎所有排名因素統(tǒng)計都表明,F(xiàn)acebook和Twitter等社交媒體上的點贊數(shù)、分享數(shù)、轉(zhuǎn)發(fā)數(shù)等是與Google排名相關(guān)性最高的因素,或者說兩者同時出現(xiàn)概率很高,但社交媒體互動數(shù)據(jù)高是導(dǎo)致排名好的原因嗎?或者說,是排名因素嗎?一直以來,Google的幾位員工都明確否認(rèn)社交媒體數(shù)據(jù)是排名算法中的因素。
Google員工的話不一定都可信,但社交媒體數(shù)據(jù)不是排名因素,基本上是可以相信的。兩個原因:
Google拿不到社交媒體上的完整數(shù)據(jù)。目前Google和幾個主要的社交媒體都沒有協(xié)議(以前和twitter有過),不能后臺拿數(shù)據(jù),只能靠自己抓。需要登錄才能看到的信息自然抓不了,即使是不需要登錄的,由于信息量太大,Google抓取的比例我記得以前看到過統(tǒng)計,還不到10%。
社交媒體隨時可以禁止Google抓頁面。這個就更可怕了。不能掌握在自己手里的數(shù)據(jù),用來做重要排名因素,一旦社交媒體們翻臉,Google搜索結(jié)果質(zhì)量可能直線下降。把自己的質(zhì)量控制權(quán)放在別人手里,大公司做不出這種事。
之所以社交媒體數(shù)據(jù)好的頁面同時也排名好,可能的原因包括:
社交媒體數(shù)據(jù)確實是排名因素(不是必然,但不排除這種可能)
搜索排名好導(dǎo)致社交媒體分享數(shù)據(jù)好(因果關(guān)系是反過來的)
搜索排名和社交媒體分享是另一個或一些共同因素造成的(比如頁面瀏覽量、外鏈數(shù)之類)
社交媒體互動間接造成搜索排名好
巧合
到底是哪一種,或是其它原因,我們目前無法知道。
再比如,一個相反的例子。Searchmetrics的統(tǒng)計表明。com域名與排名是負(fù)相關(guān),或者說。com域名不利于排名。這就有點費解了,一般來說。com域名都是首選啊。這很可能是被維基百科強大的排名能力干擾了,大部分查詢詞都會有一兩個維基百科的頁面排在前面,而它是。org域名。
再舉一個中性的例子。統(tǒng)計表明,排名好的頁面文字長度越來越長,那么文字長度是排名因素嗎?也許是,也許不是,也許現(xiàn)在所有頁面平均長度都變長了呢。
既然所謂的排名因素和排名之間不一定有因果關(guān)系,有些甚至明確沒有因果關(guān)系,那我們忙活什么呢?那些公司費勁統(tǒng)計它干什么呢?
首先,不一定有因果關(guān)系,但也不一定就沒有因果關(guān)系。搜索引擎不說,我們就不能確定而已。各個統(tǒng)計調(diào)查中那么多因素,總會有一些確實是搜索引擎使用中的排名因素,碰也能碰上幾個。
更重要的是,兩者的強相關(guān)度往往是有內(nèi)在原因的,雖然我們不知道確切關(guān)系。排名因素統(tǒng)計至少告訴我們,排名好的頁面都有哪些特征。如果SEO們把一個頁面優(yōu)化得和排名好的頁面一個樣,那么很大概率這個頁面也能獲得好排名,雖然我們也無法明確知道到底優(yōu)化的那一部分起了作用,起了多大作用,到底哪些因素起了作用也無所謂。