Google--PageRank技術解密(一)
Google--PageRank技術解密(一)
1. 什么是PageRank
2. PageRank的決定因素
3. 如何查知PageRank
4. PageRank的重要性
5. Google的前1,000項搜索結果
6. PageRank與其它影響網站排名因素間的區(qū)別
一:什么是PageRank(網頁級別)
PageRank(網頁級別)是Google用于評測一個網頁“重要性”的一種方法。在揉合了諸如Title標識和Keywords標識等所有其它因素之后,Google通過PageRank來調整結果,使那些更具“重要性”的網頁在搜索結果中另網站排名獲得提升,從而提高搜索結果的相關性和質量。
簡單說來,Google通過下述幾個步驟來實現(xiàn)網頁在其搜索結果頁(SERPS)中的排名:
1) 找到所有與搜索關鍵詞匹配的網頁
2) 根據(jù)頁面因素如標題\關鍵詞密度等排列等級
3) 計算導入鏈接的錨文本中的關鍵詞
4) 通過PageRank得分調整網站排名結果
事實上,真正的網站排名過程并不是這么簡單,我們會在后面進行詳細深入的闡述。
二:PageRank的決定因素
Google的PageRank是基于這樣一個理論:若B網頁設置有連接A網頁的鏈接(B為A的導入鏈接時),說明B認為A有鏈接價值,是一個“重要”的網頁。當B網頁級別(重要性)比較高時,則A網頁可從B網頁這個導入鏈接分得一定的級別(重要性),并平均分配給A網頁上的導出鏈接。
導入鏈接(也叫逆向鏈接)指鏈至你網站的站點,也就是我們一般所說的“外部鏈接”。而當你鏈至另外一個站點,那么這個站點就是你的“導出鏈接”,即你向其它網站提供的本站鏈接。
PageRank反映了一個網頁的導入鏈接的級別(重要性)。所以一般說來,PageRank是由一個網站的導入鏈接的數(shù)量和這些鏈接的級別(重要性)所決定的。
三:如何知道一個網頁的PageRank得分
可從http://toolbar.google.com上下載并安裝Google的工具欄,這樣就能顯示所瀏覽網頁的PageRank得分了。PageRank得分從0到10,若不能顯示PageRank得分,可檢查所安裝版本號,需將老版本完全卸載,重啟機器后安裝最新版本即可。
四:PageRank的重要性
搜索引擎網站排名算法中的各排名因子的重要性均取決于它們所提供信息的質量。但如果排名因子具有易操縱性,則往往會被一些網站管理員利用來實現(xiàn)不良競爭。例如初引入的排名因子之一--關鍵詞元標識(Meta Keywords),是由于理論上它可以很好地概括反映一個頁面的內容,但后來卻由于一些網站管理員的惡意操縱而不得不黯然退出。所以“加權值”--即我們對該因子提供信息的信任程度是由排名因子的易操縱程度和操縱程度共同決定的。
PageRank無疑是頗難被操縱的一個排名因子了。但在它最初推出時針對的只是鏈接的數(shù)量,所以被一些網站管理員鉆了空子,利用鏈接工廠和訪客簿等大量低劣外部鏈接輕而易舉地達到了自己的目的。Google意識到這個問題后,便在系統(tǒng)中整合了對鏈接的質量分析,并對發(fā)現(xiàn)的作弊網站進行封殺,從而不但有效地打擊了這種做法,而且保證了結果的相關性和精準度。
五:Google的前1,000項搜索結果
一般說來,網站排名因素包括網頁標題(META TITLE),網頁正文中的關鍵詞密度,錨文本(也叫鏈接文本,指鏈接或超鏈的文本內容)和PageRank所決定的。
請記。簡慰縋ageRank是無法使你獲得比較理想的網站排名的。PageRank只是網站排名算法中的一個乘積因子,若你網站的其它排名因子的得分是零,就算你的PageRank是兩百億,最后的得分還是零。但這并不是說PageRank就毫無價值,而是在什么情況下PageRank才能完全發(fā)揮其功力。
如果在Google上進行廣泛搜索,看起來好象有幾千個結果,但實際顯示最多前1,000項結果。例如對“car rental”,顯示搜索結果為5,110,000,但實際顯示結果只有826個。而且用時只有0.81秒。試想一下,0.84秒的時間就可以計算這五百萬搜索結果的每個排名因子得分,然后給出最終我們所看到的網站排名結果嗎?
答案就在于:搜索引擎選取與查詢條件最相關的那些網頁形成一個子集來加速搜索的速度。例如:假設子集中包含2,000個元素,搜索引擎所做的就是使用排名因子中的兩到三個因素對整個數(shù)據(jù)庫進行查詢,找到針對這兩三個排名因子得分較高的前2,000個網頁。(請記住,雖然可能有五百多萬搜索結果,但最終實際顯示的1,000項搜索結果卻是從這個2,000頁的子集中提煉出來的。) 然后搜索引擎再把所有排名因子整合進這2,000項搜索結果組成的子集中并進行相應的網站排名。由于按相性進行排序,子集中越靠后的搜索結果(不是指網頁)相關性(質量)也就越低,所以搜索引擎只向用戶顯示與查詢條件最相關的前1,000項搜索結果。
請注意,在搜索引擎生成這2,000項網頁的子集中我們強調了“相關性”這個詞。即搜索引擎找尋的是與查詢條件有共同主題的網頁。如果這時候我們把PageRank考慮進去,就很可能得到一些PageRank很高但主題只是略微相關的一些搜索結果。顯然這有違搜索引擎為用戶提供最為相關和精準的搜索結果的原則。
一旦理解了為什么會如此,就說明了為什么你應當首先努力在“頁面”因子和錨文本上下足工夫,最后才是PageRank。所以關鍵在于:
你必須首先在頁面因素和/或錨文本上下足工夫,使這些排名因子能夠獲得足夠的得分,從而使你的網站能夠按目標關鍵詞躋身于這2,000項搜索結果的子集中,否則PageRank再高也與事無補。
六:PageRank和其它排名因子之間的不同
網頁Title標識 僅能被列出一次。
正文中的關鍵詞 連續(xù)的重復只會降低關鍵詞的重要性,重要的是接近度。
錨文本 加權值極高,但存在上限,超過上限的錨文本信息將被忽略或降低權值。
PageRank 潛質無窮,沒有上限的限制,但需要大量工作。
備注 其它排名因子都存在一個上限(闕值),超過上限部分其權值將降低或不再計分。PageRank則不存在此問題。
1. 什么是PageRank
2. PageRank的決定因素
3. 如何查知PageRank
4. PageRank的重要性
5. Google的前1,000項搜索結果
6. PageRank與其它影響網站排名因素間的區(qū)別
一:什么是PageRank(網頁級別)
PageRank(網頁級別)是Google用于評測一個網頁“重要性”的一種方法。在揉合了諸如Title標識和Keywords標識等所有其它因素之后,Google通過PageRank來調整結果,使那些更具“重要性”的網頁在搜索結果中另網站排名獲得提升,從而提高搜索結果的相關性和質量。
簡單說來,Google通過下述幾個步驟來實現(xiàn)網頁在其搜索結果頁(SERPS)中的排名:
1) 找到所有與搜索關鍵詞匹配的網頁
2) 根據(jù)頁面因素如標題\關鍵詞密度等排列等級
3) 計算導入鏈接的錨文本中的關鍵詞
4) 通過PageRank得分調整網站排名結果
事實上,真正的網站排名過程并不是這么簡單,我們會在后面進行詳細深入的闡述。
二:PageRank的決定因素
Google的PageRank是基于這樣一個理論:若B網頁設置有連接A網頁的鏈接(B為A的導入鏈接時),說明B認為A有鏈接價值,是一個“重要”的網頁。當B網頁級別(重要性)比較高時,則A網頁可從B網頁這個導入鏈接分得一定的級別(重要性),并平均分配給A網頁上的導出鏈接。
導入鏈接(也叫逆向鏈接)指鏈至你網站的站點,也就是我們一般所說的“外部鏈接”。而當你鏈至另外一個站點,那么這個站點就是你的“導出鏈接”,即你向其它網站提供的本站鏈接。
PageRank反映了一個網頁的導入鏈接的級別(重要性)。所以一般說來,PageRank是由一個網站的導入鏈接的數(shù)量和這些鏈接的級別(重要性)所決定的。
三:如何知道一個網頁的PageRank得分
可從http://toolbar.google.com上下載并安裝Google的工具欄,這樣就能顯示所瀏覽網頁的PageRank得分了。PageRank得分從0到10,若不能顯示PageRank得分,可檢查所安裝版本號,需將老版本完全卸載,重啟機器后安裝最新版本即可。
四:PageRank的重要性
搜索引擎網站排名算法中的各排名因子的重要性均取決于它們所提供信息的質量。但如果排名因子具有易操縱性,則往往會被一些網站管理員利用來實現(xiàn)不良競爭。例如初引入的排名因子之一--關鍵詞元標識(Meta Keywords),是由于理論上它可以很好地概括反映一個頁面的內容,但后來卻由于一些網站管理員的惡意操縱而不得不黯然退出。所以“加權值”--即我們對該因子提供信息的信任程度是由排名因子的易操縱程度和操縱程度共同決定的。
PageRank無疑是頗難被操縱的一個排名因子了。但在它最初推出時針對的只是鏈接的數(shù)量,所以被一些網站管理員鉆了空子,利用鏈接工廠和訪客簿等大量低劣外部鏈接輕而易舉地達到了自己的目的。Google意識到這個問題后,便在系統(tǒng)中整合了對鏈接的質量分析,并對發(fā)現(xiàn)的作弊網站進行封殺,從而不但有效地打擊了這種做法,而且保證了結果的相關性和精準度。
五:Google的前1,000項搜索結果
一般說來,網站排名因素包括網頁標題(META TITLE),網頁正文中的關鍵詞密度,錨文本(也叫鏈接文本,指鏈接或超鏈的文本內容)和PageRank所決定的。
請記。簡慰縋ageRank是無法使你獲得比較理想的網站排名的。PageRank只是網站排名算法中的一個乘積因子,若你網站的其它排名因子的得分是零,就算你的PageRank是兩百億,最后的得分還是零。但這并不是說PageRank就毫無價值,而是在什么情況下PageRank才能完全發(fā)揮其功力。
如果在Google上進行廣泛搜索,看起來好象有幾千個結果,但實際顯示最多前1,000項結果。例如對“car rental”,顯示搜索結果為5,110,000,但實際顯示結果只有826個。而且用時只有0.81秒。試想一下,0.84秒的時間就可以計算這五百萬搜索結果的每個排名因子得分,然后給出最終我們所看到的網站排名結果嗎?
答案就在于:搜索引擎選取與查詢條件最相關的那些網頁形成一個子集來加速搜索的速度。例如:假設子集中包含2,000個元素,搜索引擎所做的就是使用排名因子中的兩到三個因素對整個數(shù)據(jù)庫進行查詢,找到針對這兩三個排名因子得分較高的前2,000個網頁。(請記住,雖然可能有五百多萬搜索結果,但最終實際顯示的1,000項搜索結果卻是從這個2,000頁的子集中提煉出來的。) 然后搜索引擎再把所有排名因子整合進這2,000項搜索結果組成的子集中并進行相應的網站排名。由于按相性進行排序,子集中越靠后的搜索結果(不是指網頁)相關性(質量)也就越低,所以搜索引擎只向用戶顯示與查詢條件最相關的前1,000項搜索結果。
請注意,在搜索引擎生成這2,000項網頁的子集中我們強調了“相關性”這個詞。即搜索引擎找尋的是與查詢條件有共同主題的網頁。如果這時候我們把PageRank考慮進去,就很可能得到一些PageRank很高但主題只是略微相關的一些搜索結果。顯然這有違搜索引擎為用戶提供最為相關和精準的搜索結果的原則。
一旦理解了為什么會如此,就說明了為什么你應當首先努力在“頁面”因子和錨文本上下足工夫,最后才是PageRank。所以關鍵在于:
你必須首先在頁面因素和/或錨文本上下足工夫,使這些排名因子能夠獲得足夠的得分,從而使你的網站能夠按目標關鍵詞躋身于這2,000項搜索結果的子集中,否則PageRank再高也與事無補。
六:PageRank和其它排名因子之間的不同
網頁Title標識 僅能被列出一次。
正文中的關鍵詞 連續(xù)的重復只會降低關鍵詞的重要性,重要的是接近度。
錨文本 加權值極高,但存在上限,超過上限的錨文本信息將被忽略或降低權值。
PageRank 潛質無窮,沒有上限的限制,但需要大量工作。
備注 其它排名因子都存在一個上限(闕值),超過上限部分其權值將降低或不再計分。PageRank則不存在此問題。
