“HillTop”論-探索Google排名新算法(續(xù))
此外,若兩個(gè)站點(diǎn)均為相同IP地址下的宿主,則認(rèn)為其中一個(gè)是另外一個(gè)站點(diǎn)的成員站點(diǎn)。(即:若ww.abc.com和www.ibm.com均為相同IP地址下的宿主,則認(rèn)為www.abc.com是www.ibm.co.uk的成員站點(diǎn))
Hilltop算法的一個(gè)極其重要的特征在于:若沒有找到搜索引擎認(rèn)為數(shù)量足夠的“專家文件”(要求至少需有兩票),則該算法失效,即返回結(jié)果為零。換言之,對(duì)于高度明確化的查詢條件(查詢?cè)~語),Hilltop算法的結(jié)果很可能為“0”。這是該算法的一個(gè)獨(dú)特特性。如此一來,造成了SEO一族中的大部分人都深信Google的確在用“商業(yè)詞”過濾名單來過濾掉商業(yè)網(wǎng)站。
事實(shí)上,在Hilltop算法無法奏效時(shí),將顯示“舊”Google的搜索結(jié)果。這些查詢條件的集合就是SEO一族所收集并稱之為的“商業(yè)詞名單”。這一效果無意中卻提供了一個(gè)強(qiáng)有力的證據(jù),表明Google確是采用了Hilltop算法。2003年11月15號(hào),Google基于新算法的更新之后, 某分析家就指出:在進(jìn)行查詢時(shí),若對(duì)某一查詢條件加上一些“不包含”的無意義字符,如“car rental – ghjkl”,則Google將會(huì)顯示以往(算法變化前)的搜索結(jié)果,而繞過所謂的“商業(yè)詞”過濾名單。
例如,若查找“real estate –hdfkdhgk”,則Google將試圖返回所有關(guān)于“real estate”,同時(shí)內(nèi)容中又不包含“hdfkdhgk”的頁面。又由于包含“hdfkdhgk” 這種字眼的網(wǎng)頁幾乎沒有,所以按道理來講,Google返回的查詢結(jié)果應(yīng)該和“real estate”的查詢結(jié)果是相同的。然而結(jié)果卻出人意料:Google所顯示的查詢結(jié)果和采用新算法之前的搜索結(jié)果的排名是相同的。事實(shí)上,Scroogle.org這個(gè)網(wǎng)站就是捕捉Google的搜索結(jié)果在排名上的不同,并以此得出一個(gè)所謂的“商業(yè)詞”過濾名單。
在所謂的“商業(yè)詞”背后到底是什么?
我們相信,“商業(yè)詞”過濾式效果只是Hilltop算法的一個(gè)衍生癥狀。每當(dāng)用戶進(jìn)行類似“real estate –hdfkdhgk”的查詢時(shí),Google都會(huì)對(duì)整個(gè)查詢?cè)~語進(jìn)行Hilltop運(yùn)算,當(dāng)無法找到足夠的包含這種查詢?cè)~語的“專家文件”時(shí),該算法將返回一個(gè)零值(即零效果)。 這就意味著我們通過這種多少有些滑稽的特殊排除詞語繞過了Hilltop算法, 這時(shí)候Google的其它算法就該出頭發(fā)揮作用了,而它們所提供的查詢結(jié)果明顯地和算法更新前的查詢結(jié)果是一樣的! 后來Scroogle.org的聲名鵲起讓Goolge發(fā)現(xiàn)了這個(gè)bug。后來Google為了防止此類漏洞,索性把查詢分成兩步走,先把排除條件詞語放一邊,將查詢條件送至Hilltop進(jìn)行運(yùn)算,如此一來,由于Hilltop不再同時(shí)對(duì)排除條件進(jìn)行解析,所以可保證其正常發(fā)揮效用,并提供相應(yīng)的搜索結(jié)果,然后再將此結(jié)果傳遞給Google算法,Google根據(jù)最初查詢中的排除條件從Hilltop提供的結(jié)果中將符合排除條件的網(wǎng)頁剔除,然后再將結(jié)果顯示給用戶。這也就是為什么我們現(xiàn)在用上面的法子再也無法看到“舊Google”的搜索結(jié)果的原因了。
Google新算法意義何在
Hilltop算法與Google的頁面等級(jí)算法及頁面相關(guān)性算法的結(jié)合看起來是超佳組合,幾乎無懈可擊。其聯(lián)姻對(duì)于鏈接流行度/頁面等級(jí)和來自專家文件(LocalScore)的鏈接對(duì)你網(wǎng)站的排名的影響程度有著深遠(yuǎn)的意義。
我列了一個(gè)簡(jiǎn)單的公式來說明新算法的效果和影響 (謹(jǐn)供參考):
“舊”Google排名公式 = {(1-d)+a (RS)} * {(1-e)+b (PR * fb)}
“新”Google排名公式 = {(1-d)+a (RS)} * {(1-e)+b (PR * fb)} *{(1-f)+c (LS)}
其中:
RS = 相關(guān)性得分:基于網(wǎng)頁標(biāo)題(Title)。元標(biāo)識(shí)(Meta tags), 正文標(biāo)題(Headlines),正文(Body text)。URL,圖片Alt文字,錨文字(Anchor Text)等元素中出現(xiàn)的關(guān)鍵詞得出的分?jǐn)?shù)。
PR = 頁面等級(jí):(基于鏈接至你網(wǎng)站的網(wǎng)頁數(shù)量及其PR值得出的分?jǐn)?shù)。原始公式為PR (A) = (1-d) + d (PR (t1)/C (t1) + …+ PR (tn)/C (tn)),其中D為阻尼因子,一般設(shè)為0.85; 公式可描述為:A網(wǎng)頁的其PR值等于鏈向該頁面的所有鏈接頁面的PR值分別除以各自的外部鏈接數(shù)量的總和。
LS = 行業(yè)得分(LocalScore):根據(jù)專家文件計(jì)算得出的分?jǐn)?shù)。
a,b,c = 調(diào)節(jié)控制比重:Google用于精工調(diào)整查詢結(jié)果
d,e,f = 阻尼控制:Google用于精工調(diào)整查詢結(jié)果。目前“f”值可能為“0”。
fb = 因子基數(shù):Google工具欄山所顯示的頁面等級(jí)得分范圍從1到10,但它實(shí)質(zhì)上并不是一個(gè)線性函數(shù),而是一個(gè)指數(shù)/對(duì)數(shù)函數(shù)。經(jīng)過分析,我們認(rèn)為它有一個(gè)趨近于8的基數(shù)。即PR為5的網(wǎng)頁的值比PR為4要多8倍之多(PR5=PR4X8),同樣,一個(gè)PR值為8的網(wǎng)站比一個(gè)PR值為4的網(wǎng)站的值要高出4000多倍(PR8=PR4X8X8X8X8)。
Google新算法的優(yōu)勢(shì)/優(yōu)點(diǎn)
頁面因子極易被人利用和控制,例如最早被用作排名因子的META TAGS,就由于很多網(wǎng)站無度的關(guān)鍵詞充斥泛濫而不得不被搜索引擎喊停。此外,在開始的時(shí)候,由于顧忌到真實(shí)來訪者的感受,對(duì)網(wǎng)站內(nèi)容一般作手腳的并不多,但后來亦難免誘惑,過度優(yōu)化,甚至頁面上放上許多“隱形”的內(nèi)容已是屢見不鮮的伎倆。頁面因子確實(shí)無形中賦予網(wǎng)站管理員太多“惡意”控制權(quán)。而在Google的新算法中,各排名因素所占比重分別如下:
總“排名”得分由三部分組成:相關(guān)性得分(頁面因素),頁面等級(jí)得分(非頁面因素)和行業(yè)得分(非頁面因素):
相關(guān)性得分(RS)= 20%,頁面等級(jí)值(PR) = 40%,行業(yè)得分(LS) = 40%
其中:
RS (相關(guān)性得分:頁面相關(guān)度) --是所有SEO努力的轉(zhuǎn)換結(jié)果;
PR (頁面等級(jí)得分:外部鏈接度) --是所有建立鏈接的努力的轉(zhuǎn)換結(jié)果;
LS (行業(yè)得分:專家文件鏈接度) --是得自專家文件的鏈接的轉(zhuǎn)換結(jié)果;
從上述結(jié)果不難看出,頁面優(yōu)化的得分只占到20%,Google顯然已將重心轉(zhuǎn)至非頁面因子上,而把排名控制權(quán)越來越多地從網(wǎng)站管理員手中奪回來。假若一個(gè)水平一般般的優(yōu)化專家可以拿到RS中的10分,而一個(gè)水平很高的優(yōu)化專家最高也不過能拿到18,19分,大家可以看到:這兩個(gè)水平懸殊的優(yōu)化專家之間的差別僅僅只有8分而已!
Hilltop算法是否以實(shí)時(shí)方式運(yùn)行
Google所擁有的服務(wù)器體系架構(gòu)就是網(wǎng)絡(luò)上分布的一萬臺(tái)奔騰級(jí)服務(wù)器。而一旦了解了Hilltop算法后,我們很難相信這樣的奔騰服務(wù)器能夠具備如此的處理能力:試想一下,首先要從成千上萬的主題性文件中找到“專家文件”,然后計(jì)算目標(biāo)網(wǎng)頁自這些專家文件的鏈接的得分,然后再將數(shù)值返回Google算法的其它排名系統(tǒng),并做進(jìn)一步處理—而所有這些要在大約0.07秒內(nèi)--這個(gè)讓Google舉世聞名的搜索速度內(nèi)完成。確實(shí)使人難以置信。
Hilltop算法的運(yùn)行頻率及涵蓋范圍
我們認(rèn)為,要保證Google一貫的“閃電般”搜索速度,Google會(huì)對(duì)搜索頻率較高(熱門)的查詢?cè)~(即所謂的“商業(yè)詞”黑名單)定期運(yùn)行批處理,并將結(jié)果存儲(chǔ)起來供日后使用。Google的數(shù)據(jù)庫擁有數(shù)目龐大的高查詢頻率的查詢?cè)~,收集自實(shí)地搜索和其AdWords自助廣告系統(tǒng)中所使用的關(guān)鍵詞。Google很可能對(duì)關(guān)鍵詞搜索次數(shù)設(shè)置了上限值,凡搜索頻率高于此閾值的查詢?cè)~都將被納入Hilltop系統(tǒng),然后Hilltop系統(tǒng)再對(duì)收集的所有高查詢頻率關(guān)鍵詞定期運(yùn)行批處理,可能一個(gè)月一次。增量級(jí)的稍小規(guī)模的批處理可能會(huì)頻繁一些。 同時(shí),每個(gè)月將對(duì)Hilltop系統(tǒng)運(yùn)行批處理后的結(jié)果對(duì)Google的萬臺(tái)服務(wù)器的數(shù)據(jù)庫進(jìn)行同步更新,但稍小規(guī)模的批處理的數(shù)據(jù)庫更新會(huì)更加頻繁一些。
對(duì)于那些用戶查詢頻率不算高,因而無此“榮幸”被納入Hilltop算法的查詢?cè)~語,Google仍將使用原來的算法并顯示原來的排名結(jié)果。因而對(duì)于那些高度明確或?qū)I(yè)化的關(guān)鍵詞,由于它們被排除在新算法的范圍之內(nèi),因而有望保持原來的排名。
Hilltop算法為何經(jīng)過如此長(zhǎng)時(shí)間才投入使用
Google早在2003年2月就獲得了該專利,但在實(shí)際投入使用前,需要首先保證新算法和Google當(dāng)時(shí)所使用的頁面等級(jí)和頁面相關(guān)性系統(tǒng)的完全兼容性,所以需要對(duì)其兼容性做大量測(cè)試,然后再評(píng)估算法整合后所提供的結(jié)果,再做精工調(diào)整,然后是進(jìn)一步的繁復(fù)測(cè)試…我想所有這些都需要大量時(shí)間。
Google新算法的不利方面/瑕疵
經(jīng)過進(jìn)一步分析,我們發(fā)現(xiàn)了該算法存在著的若干缺陷和不足:
Hilltop的前提是每個(gè)專家文件都是完全公正的,且無欺騙和人工操縱成分。然而情況可能并非如此理想。專家文件的一個(gè)小小污點(diǎn)就可以對(duì)排名產(chǎn)生極大的負(fù)面影響。
Hilltop意圖通過“權(quán)威性”專家文件的鏈接來確定一個(gè)網(wǎng)頁的行業(yè)可信度,但又不能夠明確保證這些所謂的“專家文件”的”“量”確是名副其實(shí)。
運(yùn)行Hilltop算法需要大量的計(jì)算機(jī)處理能力,因而我們猜測(cè)Hilltop算法(可能)是每個(gè)月對(duì)收集到的全部高頻率(熱門)查詢?cè)~運(yùn)行一次批處理。由于Google算法將40%重心轉(zhuǎn)移至Hilltop,且Hilltop算法運(yùn)行后的得分會(huì)保持至下一次批處理,因而在此期間搜索結(jié)果很可能不會(huì)有太大變動(dòng)。此外,由于“專家”網(wǎng)頁的投票方式往往不會(huì)有太大變動(dòng),因而在某段時(shí)期內(nèi)我們可能只會(huì)看到一些“陳舊”的搜索結(jié)果。這一點(diǎn)悖離了搜索引擎的“提供最新、最好”的查詢結(jié)果的宗旨。除了“權(quán)威網(wǎng)頁”,用戶同樣希望看到一些新鮮的內(nèi)容,然而對(duì)“新”Google而言,用戶只有寄望于那些查詢頻率不太高,從而未被納入Hilltop系統(tǒng)的查詢?cè)~語上看到“新鮮”的查詢結(jié)果了。
新站點(diǎn)對(duì)熱門查詢?cè)~的排名的難度將越發(fā)加大?磥韺(duì)于那些特別熱門的查詢?cè)~,Google對(duì)新網(wǎng)站或新內(nèi)容的排名的門檻是越來越高了。
商業(yè)性站點(diǎn)要鏈向網(wǎng)絡(luò)分類目錄,貿(mào)易協(xié)會(huì),政府貿(mào)易機(jī)構(gòu),教育機(jī)構(gòu),公益性組織的站點(diǎn)并非難事,故而這樣的站點(diǎn)會(huì)占據(jù)搜索結(jié)果的前十名位置。
哪些站點(diǎn)是Google新算法最可能的殃及者?
成員站點(diǎn)/域群集/運(yùn)行于相同服務(wù)器下的MLM(多層營(yíng)銷系統(tǒng)程序)程序。
過度依賴“頁面”優(yōu)化因子的網(wǎng)站。
依賴高度競(jìng)爭(zhēng)性的查詢?cè)~語來獲得訪問量的網(wǎng)站。
對(duì)網(wǎng)站擁有者的若干建議:
排名規(guī)則已發(fā)生重大改變,網(wǎng)站的成功推廣需從提高PR值及獲得更多來自“專家文件”的鏈接著手;
盡可能為更多主流網(wǎng)上分類目錄(DMOZ,Yahoo,About,LookSmart等),貿(mào)易目錄,黃頁,貿(mào)易協(xié)會(huì)和資源頁等所收錄;
避免使用域群集/成員程序或帶有成員性質(zhì)的系統(tǒng);
避免來自可疑的FFA站點(diǎn)及鏈接工廠的互惠鏈接。
若干需要澄清的傳言:
關(guān)于“過度優(yōu)化會(huì)受到懲罰”之說--過濾優(yōu)化本身就是一種SPAM,因而受到懲罰也是理所當(dāng)然的事情。然而當(dāng)前大多數(shù)商業(yè)網(wǎng)站所受到的排名沖擊并非由于受到懲罰,而是由Google將重心從頁面因子轉(zhuǎn)至非頁面因子而造成的。網(wǎng)站的良好優(yōu)化仍必不可少。
關(guān)于“建立外部鏈接不再重要”之說--建立鏈接流行度還是和從前一樣舉足輕重,甚至還有可能會(huì)更加重要。Google專利的頁面等級(jí)算法仍舊占據(jù)舉足輕重的地位。
關(guān)于“Google開始使用‘商業(yè)詞’過濾名單”之說--Google并沒有使用任何“過濾名單”來懲罰商業(yè)站點(diǎn)。Google也無意去“懲罰”或“篩掉”任何東西,它所力求的只是建立一個(gè)能夠識(shí)別最具備相關(guān)性網(wǎng)頁的系統(tǒng)。
站點(diǎn)收錄進(jìn)DMOZ,Google目錄和商業(yè)目錄收錄會(huì)讓Google認(rèn)為該站點(diǎn)屬商業(yè)性網(wǎng)站,從而對(duì)其進(jìn)行懲罰--正相反,由于這些目錄都是質(zhì)量非常之高的“專家文件”,因而得到這些目錄的鏈接不但不會(huì)受到懲罰,反而會(huì)帶給你較高的收益。
隨著Google對(duì)其算法的大更新,我們不得不承認(rèn),要想讓網(wǎng)站得到好的排名真是越來越不容易了。若只采用簡(jiǎn)單的優(yōu)化技術(shù),如元標(biāo)識(shí)(Meta)或頁面優(yōu)化,幾乎沒辦法得到理想排名。我們需要顧及很多的算法變量,而不僅僅是一個(gè)Meta Tags。搜索引擎優(yōu)化會(huì)更為專業(yè)化。老式的優(yōu)化伎倆已經(jīng)不管用或收效甚微了,F(xiàn)在需要計(jì)劃和實(shí)施的是全方位的SEO策略。為保證成效,SEO專家現(xiàn)在需要做的是投入更多的智慧、研究、分析、計(jì)劃和時(shí)間。這樣的話,SEO的優(yōu)化“成本”亦將逐漸增高。
PPC(付費(fèi)點(diǎn)擊)的價(jià)格會(huì)繼續(xù)攀升。PPC廣告方式不但會(huì)成為網(wǎng)上營(yíng)銷策略的一個(gè)主要組成部分,而且需要保證相應(yīng)的搜索引擎訪問量。現(xiàn)在,網(wǎng)站的外部鏈接和頁面等級(jí)愈加重要。它對(duì)排名的影響更加重要。搜索引擎優(yōu)化和建立鏈接的結(jié)合已勢(shì)在必行。此外,搜索引擎排名算法的更新不僅會(huì)越加頻繁,而且幅度會(huì)越來越大。現(xiàn)在,定期的搜索引擎優(yōu)化維護(hù)變得尤為重要。對(duì)網(wǎng)站的搜索引擎優(yōu)化不僅是必須的,而且大有裨益。
很多網(wǎng)站都丟掉了它們?cè)瓉淼暮门琶,因而尤其需要搜索?yōu)化專家。每一次更新算法都是對(duì)搜索引擎優(yōu)化人員名單的一次縮水。搜索引擎的優(yōu)化和排名生意變得愈加困難,然而也愈加重要了。
Hilltop算法的一個(gè)極其重要的特征在于:若沒有找到搜索引擎認(rèn)為數(shù)量足夠的“專家文件”(要求至少需有兩票),則該算法失效,即返回結(jié)果為零。換言之,對(duì)于高度明確化的查詢條件(查詢?cè)~語),Hilltop算法的結(jié)果很可能為“0”。這是該算法的一個(gè)獨(dú)特特性。如此一來,造成了SEO一族中的大部分人都深信Google的確在用“商業(yè)詞”過濾名單來過濾掉商業(yè)網(wǎng)站。
事實(shí)上,在Hilltop算法無法奏效時(shí),將顯示“舊”Google的搜索結(jié)果。這些查詢條件的集合就是SEO一族所收集并稱之為的“商業(yè)詞名單”。這一效果無意中卻提供了一個(gè)強(qiáng)有力的證據(jù),表明Google確是采用了Hilltop算法。2003年11月15號(hào),Google基于新算法的更新之后, 某分析家就指出:在進(jìn)行查詢時(shí),若對(duì)某一查詢條件加上一些“不包含”的無意義字符,如“car rental – ghjkl”,則Google將會(huì)顯示以往(算法變化前)的搜索結(jié)果,而繞過所謂的“商業(yè)詞”過濾名單。
例如,若查找“real estate –hdfkdhgk”,則Google將試圖返回所有關(guān)于“real estate”,同時(shí)內(nèi)容中又不包含“hdfkdhgk”的頁面。又由于包含“hdfkdhgk” 這種字眼的網(wǎng)頁幾乎沒有,所以按道理來講,Google返回的查詢結(jié)果應(yīng)該和“real estate”的查詢結(jié)果是相同的。然而結(jié)果卻出人意料:Google所顯示的查詢結(jié)果和采用新算法之前的搜索結(jié)果的排名是相同的。事實(shí)上,Scroogle.org這個(gè)網(wǎng)站就是捕捉Google的搜索結(jié)果在排名上的不同,并以此得出一個(gè)所謂的“商業(yè)詞”過濾名單。
在所謂的“商業(yè)詞”背后到底是什么?
我們相信,“商業(yè)詞”過濾式效果只是Hilltop算法的一個(gè)衍生癥狀。每當(dāng)用戶進(jìn)行類似“real estate –hdfkdhgk”的查詢時(shí),Google都會(huì)對(duì)整個(gè)查詢?cè)~語進(jìn)行Hilltop運(yùn)算,當(dāng)無法找到足夠的包含這種查詢?cè)~語的“專家文件”時(shí),該算法將返回一個(gè)零值(即零效果)。 這就意味著我們通過這種多少有些滑稽的特殊排除詞語繞過了Hilltop算法, 這時(shí)候Google的其它算法就該出頭發(fā)揮作用了,而它們所提供的查詢結(jié)果明顯地和算法更新前的查詢結(jié)果是一樣的! 后來Scroogle.org的聲名鵲起讓Goolge發(fā)現(xiàn)了這個(gè)bug。后來Google為了防止此類漏洞,索性把查詢分成兩步走,先把排除條件詞語放一邊,將查詢條件送至Hilltop進(jìn)行運(yùn)算,如此一來,由于Hilltop不再同時(shí)對(duì)排除條件進(jìn)行解析,所以可保證其正常發(fā)揮效用,并提供相應(yīng)的搜索結(jié)果,然后再將此結(jié)果傳遞給Google算法,Google根據(jù)最初查詢中的排除條件從Hilltop提供的結(jié)果中將符合排除條件的網(wǎng)頁剔除,然后再將結(jié)果顯示給用戶。這也就是為什么我們現(xiàn)在用上面的法子再也無法看到“舊Google”的搜索結(jié)果的原因了。
Google新算法意義何在
Hilltop算法與Google的頁面等級(jí)算法及頁面相關(guān)性算法的結(jié)合看起來是超佳組合,幾乎無懈可擊。其聯(lián)姻對(duì)于鏈接流行度/頁面等級(jí)和來自專家文件(LocalScore)的鏈接對(duì)你網(wǎng)站的排名的影響程度有著深遠(yuǎn)的意義。
我列了一個(gè)簡(jiǎn)單的公式來說明新算法的效果和影響 (謹(jǐn)供參考):
“舊”Google排名公式 = {(1-d)+a (RS)} * {(1-e)+b (PR * fb)}
“新”Google排名公式 = {(1-d)+a (RS)} * {(1-e)+b (PR * fb)} *{(1-f)+c (LS)}
其中:
RS = 相關(guān)性得分:基于網(wǎng)頁標(biāo)題(Title)。元標(biāo)識(shí)(Meta tags), 正文標(biāo)題(Headlines),正文(Body text)。URL,圖片Alt文字,錨文字(Anchor Text)等元素中出現(xiàn)的關(guān)鍵詞得出的分?jǐn)?shù)。
PR = 頁面等級(jí):(基于鏈接至你網(wǎng)站的網(wǎng)頁數(shù)量及其PR值得出的分?jǐn)?shù)。原始公式為PR (A) = (1-d) + d (PR (t1)/C (t1) + …+ PR (tn)/C (tn)),其中D為阻尼因子,一般設(shè)為0.85; 公式可描述為:A網(wǎng)頁的其PR值等于鏈向該頁面的所有鏈接頁面的PR值分別除以各自的外部鏈接數(shù)量的總和。
LS = 行業(yè)得分(LocalScore):根據(jù)專家文件計(jì)算得出的分?jǐn)?shù)。
a,b,c = 調(diào)節(jié)控制比重:Google用于精工調(diào)整查詢結(jié)果
d,e,f = 阻尼控制:Google用于精工調(diào)整查詢結(jié)果。目前“f”值可能為“0”。
fb = 因子基數(shù):Google工具欄山所顯示的頁面等級(jí)得分范圍從1到10,但它實(shí)質(zhì)上并不是一個(gè)線性函數(shù),而是一個(gè)指數(shù)/對(duì)數(shù)函數(shù)。經(jīng)過分析,我們認(rèn)為它有一個(gè)趨近于8的基數(shù)。即PR為5的網(wǎng)頁的值比PR為4要多8倍之多(PR5=PR4X8),同樣,一個(gè)PR值為8的網(wǎng)站比一個(gè)PR值為4的網(wǎng)站的值要高出4000多倍(PR8=PR4X8X8X8X8)。
Google新算法的優(yōu)勢(shì)/優(yōu)點(diǎn)
頁面因子極易被人利用和控制,例如最早被用作排名因子的META TAGS,就由于很多網(wǎng)站無度的關(guān)鍵詞充斥泛濫而不得不被搜索引擎喊停。此外,在開始的時(shí)候,由于顧忌到真實(shí)來訪者的感受,對(duì)網(wǎng)站內(nèi)容一般作手腳的并不多,但后來亦難免誘惑,過度優(yōu)化,甚至頁面上放上許多“隱形”的內(nèi)容已是屢見不鮮的伎倆。頁面因子確實(shí)無形中賦予網(wǎng)站管理員太多“惡意”控制權(quán)。而在Google的新算法中,各排名因素所占比重分別如下:
總“排名”得分由三部分組成:相關(guān)性得分(頁面因素),頁面等級(jí)得分(非頁面因素)和行業(yè)得分(非頁面因素):
相關(guān)性得分(RS)= 20%,頁面等級(jí)值(PR) = 40%,行業(yè)得分(LS) = 40%
其中:
RS (相關(guān)性得分:頁面相關(guān)度) --是所有SEO努力的轉(zhuǎn)換結(jié)果;
PR (頁面等級(jí)得分:外部鏈接度) --是所有建立鏈接的努力的轉(zhuǎn)換結(jié)果;
LS (行業(yè)得分:專家文件鏈接度) --是得自專家文件的鏈接的轉(zhuǎn)換結(jié)果;
從上述結(jié)果不難看出,頁面優(yōu)化的得分只占到20%,Google顯然已將重心轉(zhuǎn)至非頁面因子上,而把排名控制權(quán)越來越多地從網(wǎng)站管理員手中奪回來。假若一個(gè)水平一般般的優(yōu)化專家可以拿到RS中的10分,而一個(gè)水平很高的優(yōu)化專家最高也不過能拿到18,19分,大家可以看到:這兩個(gè)水平懸殊的優(yōu)化專家之間的差別僅僅只有8分而已!
Hilltop算法是否以實(shí)時(shí)方式運(yùn)行
Google所擁有的服務(wù)器體系架構(gòu)就是網(wǎng)絡(luò)上分布的一萬臺(tái)奔騰級(jí)服務(wù)器。而一旦了解了Hilltop算法后,我們很難相信這樣的奔騰服務(wù)器能夠具備如此的處理能力:試想一下,首先要從成千上萬的主題性文件中找到“專家文件”,然后計(jì)算目標(biāo)網(wǎng)頁自這些專家文件的鏈接的得分,然后再將數(shù)值返回Google算法的其它排名系統(tǒng),并做進(jìn)一步處理—而所有這些要在大約0.07秒內(nèi)--這個(gè)讓Google舉世聞名的搜索速度內(nèi)完成。確實(shí)使人難以置信。
Hilltop算法的運(yùn)行頻率及涵蓋范圍
我們認(rèn)為,要保證Google一貫的“閃電般”搜索速度,Google會(huì)對(duì)搜索頻率較高(熱門)的查詢?cè)~(即所謂的“商業(yè)詞”黑名單)定期運(yùn)行批處理,并將結(jié)果存儲(chǔ)起來供日后使用。Google的數(shù)據(jù)庫擁有數(shù)目龐大的高查詢頻率的查詢?cè)~,收集自實(shí)地搜索和其AdWords自助廣告系統(tǒng)中所使用的關(guān)鍵詞。Google很可能對(duì)關(guān)鍵詞搜索次數(shù)設(shè)置了上限值,凡搜索頻率高于此閾值的查詢?cè)~都將被納入Hilltop系統(tǒng),然后Hilltop系統(tǒng)再對(duì)收集的所有高查詢頻率關(guān)鍵詞定期運(yùn)行批處理,可能一個(gè)月一次。增量級(jí)的稍小規(guī)模的批處理可能會(huì)頻繁一些。 同時(shí),每個(gè)月將對(duì)Hilltop系統(tǒng)運(yùn)行批處理后的結(jié)果對(duì)Google的萬臺(tái)服務(wù)器的數(shù)據(jù)庫進(jìn)行同步更新,但稍小規(guī)模的批處理的數(shù)據(jù)庫更新會(huì)更加頻繁一些。
對(duì)于那些用戶查詢頻率不算高,因而無此“榮幸”被納入Hilltop算法的查詢?cè)~語,Google仍將使用原來的算法并顯示原來的排名結(jié)果。因而對(duì)于那些高度明確或?qū)I(yè)化的關(guān)鍵詞,由于它們被排除在新算法的范圍之內(nèi),因而有望保持原來的排名。
Hilltop算法為何經(jīng)過如此長(zhǎng)時(shí)間才投入使用
Google早在2003年2月就獲得了該專利,但在實(shí)際投入使用前,需要首先保證新算法和Google當(dāng)時(shí)所使用的頁面等級(jí)和頁面相關(guān)性系統(tǒng)的完全兼容性,所以需要對(duì)其兼容性做大量測(cè)試,然后再評(píng)估算法整合后所提供的結(jié)果,再做精工調(diào)整,然后是進(jìn)一步的繁復(fù)測(cè)試…我想所有這些都需要大量時(shí)間。
Google新算法的不利方面/瑕疵
經(jīng)過進(jìn)一步分析,我們發(fā)現(xiàn)了該算法存在著的若干缺陷和不足:
Hilltop的前提是每個(gè)專家文件都是完全公正的,且無欺騙和人工操縱成分。然而情況可能并非如此理想。專家文件的一個(gè)小小污點(diǎn)就可以對(duì)排名產(chǎn)生極大的負(fù)面影響。
Hilltop意圖通過“權(quán)威性”專家文件的鏈接來確定一個(gè)網(wǎng)頁的行業(yè)可信度,但又不能夠明確保證這些所謂的“專家文件”的”“量”確是名副其實(shí)。
運(yùn)行Hilltop算法需要大量的計(jì)算機(jī)處理能力,因而我們猜測(cè)Hilltop算法(可能)是每個(gè)月對(duì)收集到的全部高頻率(熱門)查詢?cè)~運(yùn)行一次批處理。由于Google算法將40%重心轉(zhuǎn)移至Hilltop,且Hilltop算法運(yùn)行后的得分會(huì)保持至下一次批處理,因而在此期間搜索結(jié)果很可能不會(huì)有太大變動(dòng)。此外,由于“專家”網(wǎng)頁的投票方式往往不會(huì)有太大變動(dòng),因而在某段時(shí)期內(nèi)我們可能只會(huì)看到一些“陳舊”的搜索結(jié)果。這一點(diǎn)悖離了搜索引擎的“提供最新、最好”的查詢結(jié)果的宗旨。除了“權(quán)威網(wǎng)頁”,用戶同樣希望看到一些新鮮的內(nèi)容,然而對(duì)“新”Google而言,用戶只有寄望于那些查詢頻率不太高,從而未被納入Hilltop系統(tǒng)的查詢?cè)~語上看到“新鮮”的查詢結(jié)果了。
新站點(diǎn)對(duì)熱門查詢?cè)~的排名的難度將越發(fā)加大?磥韺(duì)于那些特別熱門的查詢?cè)~,Google對(duì)新網(wǎng)站或新內(nèi)容的排名的門檻是越來越高了。
商業(yè)性站點(diǎn)要鏈向網(wǎng)絡(luò)分類目錄,貿(mào)易協(xié)會(huì),政府貿(mào)易機(jī)構(gòu),教育機(jī)構(gòu),公益性組織的站點(diǎn)并非難事,故而這樣的站點(diǎn)會(huì)占據(jù)搜索結(jié)果的前十名位置。
哪些站點(diǎn)是Google新算法最可能的殃及者?
成員站點(diǎn)/域群集/運(yùn)行于相同服務(wù)器下的MLM(多層營(yíng)銷系統(tǒng)程序)程序。
過度依賴“頁面”優(yōu)化因子的網(wǎng)站。
依賴高度競(jìng)爭(zhēng)性的查詢?cè)~語來獲得訪問量的網(wǎng)站。
對(duì)網(wǎng)站擁有者的若干建議:
排名規(guī)則已發(fā)生重大改變,網(wǎng)站的成功推廣需從提高PR值及獲得更多來自“專家文件”的鏈接著手;
盡可能為更多主流網(wǎng)上分類目錄(DMOZ,Yahoo,About,LookSmart等),貿(mào)易目錄,黃頁,貿(mào)易協(xié)會(huì)和資源頁等所收錄;
避免使用域群集/成員程序或帶有成員性質(zhì)的系統(tǒng);
避免來自可疑的FFA站點(diǎn)及鏈接工廠的互惠鏈接。
若干需要澄清的傳言:
關(guān)于“過度優(yōu)化會(huì)受到懲罰”之說--過濾優(yōu)化本身就是一種SPAM,因而受到懲罰也是理所當(dāng)然的事情。然而當(dāng)前大多數(shù)商業(yè)網(wǎng)站所受到的排名沖擊并非由于受到懲罰,而是由Google將重心從頁面因子轉(zhuǎn)至非頁面因子而造成的。網(wǎng)站的良好優(yōu)化仍必不可少。
關(guān)于“建立外部鏈接不再重要”之說--建立鏈接流行度還是和從前一樣舉足輕重,甚至還有可能會(huì)更加重要。Google專利的頁面等級(jí)算法仍舊占據(jù)舉足輕重的地位。
關(guān)于“Google開始使用‘商業(yè)詞’過濾名單”之說--Google并沒有使用任何“過濾名單”來懲罰商業(yè)站點(diǎn)。Google也無意去“懲罰”或“篩掉”任何東西,它所力求的只是建立一個(gè)能夠識(shí)別最具備相關(guān)性網(wǎng)頁的系統(tǒng)。
站點(diǎn)收錄進(jìn)DMOZ,Google目錄和商業(yè)目錄收錄會(huì)讓Google認(rèn)為該站點(diǎn)屬商業(yè)性網(wǎng)站,從而對(duì)其進(jìn)行懲罰--正相反,由于這些目錄都是質(zhì)量非常之高的“專家文件”,因而得到這些目錄的鏈接不但不會(huì)受到懲罰,反而會(huì)帶給你較高的收益。
隨著Google對(duì)其算法的大更新,我們不得不承認(rèn),要想讓網(wǎng)站得到好的排名真是越來越不容易了。若只采用簡(jiǎn)單的優(yōu)化技術(shù),如元標(biāo)識(shí)(Meta)或頁面優(yōu)化,幾乎沒辦法得到理想排名。我們需要顧及很多的算法變量,而不僅僅是一個(gè)Meta Tags。搜索引擎優(yōu)化會(huì)更為專業(yè)化。老式的優(yōu)化伎倆已經(jīng)不管用或收效甚微了,F(xiàn)在需要計(jì)劃和實(shí)施的是全方位的SEO策略。為保證成效,SEO專家現(xiàn)在需要做的是投入更多的智慧、研究、分析、計(jì)劃和時(shí)間。這樣的話,SEO的優(yōu)化“成本”亦將逐漸增高。
PPC(付費(fèi)點(diǎn)擊)的價(jià)格會(huì)繼續(xù)攀升。PPC廣告方式不但會(huì)成為網(wǎng)上營(yíng)銷策略的一個(gè)主要組成部分,而且需要保證相應(yīng)的搜索引擎訪問量。現(xiàn)在,網(wǎng)站的外部鏈接和頁面等級(jí)愈加重要。它對(duì)排名的影響更加重要。搜索引擎優(yōu)化和建立鏈接的結(jié)合已勢(shì)在必行。此外,搜索引擎排名算法的更新不僅會(huì)越加頻繁,而且幅度會(huì)越來越大。現(xiàn)在,定期的搜索引擎優(yōu)化維護(hù)變得尤為重要。對(duì)網(wǎng)站的搜索引擎優(yōu)化不僅是必須的,而且大有裨益。
很多網(wǎng)站都丟掉了它們?cè)瓉淼暮门琶,因而尤其需要搜索?yōu)化專家。每一次更新算法都是對(duì)搜索引擎優(yōu)化人員名單的一次縮水。搜索引擎的優(yōu)化和排名生意變得愈加困難,然而也愈加重要了。
