搜索引擎算法是什么?詳解搜索引擎的工作原理、工作內容及算法
一、搜索引擎算法是什么
搜索引擎算法(英文:Search Arithmetic)一般簡稱為搜索算法,搜索引擎算法會對索引庫中數(shù)以千億的網(wǎng)頁進行整理,以便根據(jù)用戶查詢的關鍵詞提供最相關、最實用的結果。搜索引擎呈現(xiàn)的是成千上萬個含有實用信息的網(wǎng)頁,有時甚至是數(shù)百萬個,在輸入搜索關鍵詞之前,搜索引擎就已經(jīng)開始算計要顯示哪些結果,這些排名由一系列算法組成,而不是一個算法。搜索引擎算法會查詢的關鍵詞、網(wǎng)頁的相關性和可用性、來源的專業(yè)度,以及用戶所在的位置等因素,為每個因素賦予的權重,從而提供最佳的搜索結果給用戶。
二、搜索引擎工作原理
首先,我們要先了解搜索引擎的運作原理。搜索引擎蜘蛛又稱為網(wǎng)絡爬蟲,來抓取整個互聯(lián)網(wǎng)的網(wǎng)站,并且進行檢索,最后將這些網(wǎng)頁的數(shù)據(jù)反饋回服務器,并記錄在搜索索引中。因此,搜索引擎的檢索就像是圖書館的中央歸檔系統(tǒng),將每一本書(網(wǎng)頁),進行分類、歸檔,讓用戶方便搜索。
1、基本概述
搜索引擎蜘蛛即Search Engine Spider,是一個很形象的名字。把互聯(lián)網(wǎng)比喻成一張蜘蛛網(wǎng),那么Spider就是在網(wǎng)上爬來爬去的蜘蛛。搜索引擎蜘蛛是通過網(wǎng)頁的鏈接地址來尋找網(wǎng)頁,從 網(wǎng)站某一個頁面(通常是首頁)開始,讀取網(wǎng)頁的內容,找到在網(wǎng)頁中的其它鏈接地址,然后通過這些鏈接地址尋找下一個網(wǎng)頁,這樣一直循環(huán)下去,直到把這個網(wǎng)站所有的網(wǎng)頁都抓取完為止。如果把整個互聯(lián)網(wǎng)當成一個網(wǎng),那么搜索引擎蜘蛛就可以用這個原理把互聯(lián)網(wǎng)上所有節(jié)點的網(wǎng)頁都抓取下來。
由于互聯(lián)網(wǎng)上無數(shù)的網(wǎng)站頁面,搜索引擎蜘蛛無法將所有的頁面都下載保存到服務器。因此,許多搜索引擎的網(wǎng)絡蜘 蛛只是抓取那些重要的網(wǎng)頁,而在抓取的時候評價重要性主要的依據(jù)是某個網(wǎng)頁的鏈接廣泛度(及外部鏈接的數(shù)量與質量)。
2、抓取網(wǎng)頁策略
在抓取網(wǎng)頁的時候,搜索引擎蜘蛛一般有兩種策略:廣度優(yōu)先和深度優(yōu)先(如下圖所示)。廣度優(yōu)先是指搜索引擎蜘蛛會先抓取起始網(wǎng)頁中鏈接的所有網(wǎng)頁,然后再選擇其中 的一個鏈接網(wǎng)頁,繼續(xù)抓取在此網(wǎng)頁中鏈接的所有網(wǎng)頁。這是最常用的方式,因為這個方法可以讓搜索引擎蜘蛛并行處理,提高其抓取速度。深度優(yōu)先是指搜索引擎蜘蛛會從 起始頁開始,一個鏈接一個鏈接跟蹤下去,處理完這條線路之后再轉入下一個起始頁,繼續(xù)跟蹤鏈接。這個方法有個優(yōu)點是搜索引擎蜘蛛在設計的時候比較容易。兩種策略的區(qū)別,下圖的說明會更加明確。由于不可能抓取所有的網(wǎng)頁,有些搜索引擎蜘蛛對一些不太重要的網(wǎng)站,設置了訪問的層數(shù)。例如,在上圖中,A為起始網(wǎng)頁,屬于0層,B、C、D、E、F屬于第1 層,G、H屬于第2層,I屬于第3層。如果搜索引擎蜘蛛設置的訪問層數(shù)為2的話,網(wǎng)頁I是不會被訪問到的。這也讓有些網(wǎng)站上一部分網(wǎng)頁能夠在搜索引擎上搜索 到,另外一部分不能被搜索到。 對于網(wǎng)站設計者來說,扁平化的網(wǎng)站結構設計有助于搜索引擎抓取其更多的網(wǎng)頁。
3、訪問網(wǎng)站權限
搜索引擎蜘蛛在訪問網(wǎng)站網(wǎng)頁的時候,經(jīng)常會遇到加密數(shù)據(jù)和網(wǎng)頁權限的問題,有些網(wǎng)頁是需要會員權限才能訪問。當然,網(wǎng)站的所有者可以通過協(xié)議讓搜索引擎蜘蛛不去抓取,但對于一些出售報告的網(wǎng)站,他們希望搜索引擎能搜索到他們的報告,但又不能完全免費的讓搜索者查看,這樣就需要給搜索引擎蜘蛛提供相應的 用戶名和密碼。搜索引擎蜘蛛可以通過所給的權限對這些網(wǎng)頁進行網(wǎng)頁抓取,從而提供搜索。而當搜索者點擊查看該網(wǎng)頁的時候,同樣需要搜索者提供相應的權限驗證。
三、搜索引擎工作內容
搜索引擎的數(shù)據(jù)庫是依靠一個叫"網(wǎng)絡機器人(crawlers)"或叫"網(wǎng)絡蜘蛛(Spider)"的軟件,通過網(wǎng)絡上的各種鏈接自動獲取大量網(wǎng)頁信息內容,并按一定的規(guī)則分析整理形成的。Google、百度都是比較典型的搜索引擎系統(tǒng)。
1、收錄頁面
一般收錄頁面需要有搜索蜘蛛抓取完成,通過抓取算法來決定收錄哪些頁面,在百度的算法調整后,對于偽原創(chuàng)、采集站點予以強烈的打擊,所以搜索引擎在收錄頁面方面變得更加的嚴格了,高質量內容頁面以及權重高的站點一般收錄頁面的幾率會高很多。對于收錄頁面這方面相信很多的站長都是很清楚的,每天搜索蜘蛛都在分分秒秒不停地收錄著,但是你會發(fā)現(xiàn)其實大部分的站點的收錄都減少了,這是為什么呢?因為搜索需要過濾頁面。
2、過濾頁面
很多頁面被搜索引擎收錄之后,搜索引擎認為該頁面對用戶沒有太大的價值,或者是質量比較低的頁面,搜索引擎必然就會過濾,這也是用戶體驗好的一種表現(xiàn),很多站點以優(yōu)化為目的,絲毫不考慮用戶的體驗,例如一些橋頁、跳轉頁面這些就是典型,搜索引擎的k站就是一種過濾頁面的表現(xiàn),把那些作弊的站點的頁面全部的過濾掉。要知道多少人在使用搜索引擎,如果搜索出來的信息是你為了優(yōu)化而運營的站點,低質量的頁面,那搜索引擎其實是拿自己未來的前途給你優(yōu)化站點做鋪墊的。所以過濾頁面這方面搜索引擎非常的嚴格,大家也不要使用SEO作弊技術了。
3、建立索引
經(jīng)過了收錄頁面以及過濾頁面的工作之后,搜索引擎會對這些頁面逐一進行標記和識別,并將這些信息進行儲存為結構化的數(shù)據(jù),儲存到搜索引擎的搜索服務器中,這些儲存的數(shù)據(jù)有網(wǎng)頁的主要內容、網(wǎng)頁的標題標簽、關鍵詞標簽、頁面描述標簽、網(wǎng)頁外鏈及抓取記錄。還會將網(wǎng)頁中的關鍵詞信息進行識別和儲存,以便與用戶搜索的內容進行匹配。建立完善的索引數(shù)據(jù)庫,方便呈現(xiàn)出最佳的顯示信息
4、顯示信息
用戶輸入的關鍵詞,搜索引擎會對其進行一系列復雜的分析,并根據(jù)分析的結論在索引庫中尋找與之最為匹配的一系列網(wǎng)頁,按照用戶輸入的關鍵詞所體現(xiàn)的需求強弱和網(wǎng)頁的優(yōu)劣進行打分,并按照最終的分數(shù)進行排列,展現(xiàn)給用戶。一般顯示出最佳信息需要是最適合匹配關鍵詞相關的頁面,包括站內優(yōu)化和站外優(yōu)化的因素。
四、搜索引擎算法
1、百度搜索引擎算法
百度搜索有石榴算法、綠蘿算法、颶風算法、白楊算法、輕舟算法、驚雷算法、天網(wǎng)算法、烽火算法、細雨算法、石榴算法、極光算法、閃電算法、藍天算法、冰桶算法等。谷歌搜索有熊貓算法、企鵝算法、蜂鳥算法、TrustRank算法、BadRank算法、PageRank算法、HillTop算法等。
(1)、石榴算法
算法主旨:主要打擊低質量的網(wǎng)站。
算法詳情:2013年5月17日,百度搜索針對低質量網(wǎng)站的進一步打擊的升級版,與之前百度綠蘿算法相對應,這正是百度搜索引擎提高用戶體驗,提高搜索質量的有力手段。
站長規(guī)避:惡劣彈窗、大量混淆頁面主體內容等垃圾廣告。
(2)、綠蘿算法
算法主旨:主要打擊鏈接的買賣,鏈接的惡意交換以及惡意發(fā)布外鏈的行為。
算法詳情:2013年2月19日上線的一種搜索引擎反作弊的算法。該算法主要打擊超鏈中介、出賣鏈接、購買鏈接等超鏈作弊行為。該算法的推出有效制止惡意交換鏈接,發(fā)布外鏈的行為,有效凈化互聯(lián)網(wǎng)生態(tài)圈。
站長規(guī)避:買賣鏈接。
(3)、颶風算法
算法主旨:百度推出颶風算法,嚴厲打擊惡劣采集。
算法詳情:百度搜索于近日推出颶風算法,旨在嚴厲打擊以惡劣采集為內容主要來源的網(wǎng)站,同時百度搜索將從索引庫中徹底清除惡劣采集鏈接,給優(yōu)質原創(chuàng)內容提供更多展示機會,促進搜索生態(tài)良性發(fā)展。
颶風算法會例行產(chǎn)出懲罰數(shù)據(jù),同時會根據(jù)情況隨時調整迭代,體現(xiàn)了百度搜索對惡劣采集的零容忍。
站長規(guī)避:遠離內容采集,遠離垃圾重復內容、遠離抄襲,重視原創(chuàng)內容,多提供原創(chuàng)內容。
(4)、白楊算法
算法主旨:對符合百度地域優(yōu)化標準的優(yōu)質站點進行優(yōu)先展現(xiàn)。
算法詳情:白楊算法通過地域優(yōu)化服務,會將當?shù)刭Y源所歸屬的城市以前置的形式標識出來,當用戶要查找當?shù)鼗蚺R近的信息時,滿足需求的站點會排在前面。
站長規(guī)避:僅將需要本地排名的網(wǎng)頁進行標注,而無需本地排名的網(wǎng)頁則無需標注,這樣會更有針對性,減少搜索引擎判斷出錯的幾率。
(5)、輕舟算法
算法主旨:針對PC站點與移動端達到適配。
算法詳情:移動優(yōu)先原則,有移動適配的網(wǎng)站獲得更多的展示,可通過跳轉適配、代碼適配和自適應進行移動適配。
站長規(guī)避:移動用戶已經(jīng)超過PC用戶,站長建站不僅要考慮PC站,還需要建設移動站,由此獲得更好的搜索排名。
(6)、驚雷算法
算法主旨:百度搜索將于5月底推出驚雷算法2.0 打擊作弊超鏈和惡意刷點擊的作弊行為。
算法詳情:相對于驚雷算法1.0,此次升級主要針對"惡意制造作弊超鏈"和"惡意刷點擊"的作弊行為進行了算法升級。驚雷算法2.0將對作弊的網(wǎng)站限制搜索展現(xiàn)、清洗作弊鏈接、清洗點擊,并會將站點作弊行為計入站點歷史,嚴重者將永久封禁。還請存在問題的站點盡快自查整改。
站長規(guī)避:鼓勵站長多生產(chǎn)滿足用戶需求的優(yōu)質內容來獲取良性流量增長。
不要相信或觸碰搜索快排技術。抵制以不正當手段獲取流量的行為,營造健康的搜索生態(tài)。
(7)、天網(wǎng)算法
算法主旨:百度推出天網(wǎng)算法,嚴打盜取用戶隱私。
算法描述:百度網(wǎng)頁搜索發(fā)現(xiàn)部分站點存在盜取用戶隱私的行為,主要表現(xiàn)為網(wǎng)頁嵌入惡意代碼,用于盜取網(wǎng)民的QQ號、手機號。而許多網(wǎng)民卻誤認為這是百度所為。為此,百度網(wǎng)頁搜索和百度安全聯(lián)合研發(fā)天網(wǎng)算法,針對這種惡意行為進行打擊。
給站長建議:有過盜取用戶隱私行為的站點請盡快整改,待策略復查達到標準可解除懲罰。
(8)、烽火算法
算法主旨:烽火算法2.0,將嚴懲"竊取用戶數(shù)據(jù)"和"惡意劫持"的行為。
算法詳情:烽火算法2.0主要針對以下兩類問題,一是未經(jīng)用戶允許惡意竊取用戶手機號碼等隱私數(shù)據(jù)的行為,其次是惡意劫持百度流量的行為。具體包括以下行為:搜索用戶通過百度移動搜索到達網(wǎng)站后,完成閱讀要離開網(wǎng)站頁面時,通過瀏覽器返回上一級頁面被劫持到虛假的百度搜索結果中;搜索用戶通過百度移動搜索到達網(wǎng)站后,完成閱讀要離開網(wǎng)站頁面時,通過瀏覽器始終無法返回上一級百度搜索結果頁,搜索用戶會一直被困在站點內;對于網(wǎng)頁中自己主動放置惡意代碼的問題,請盡快清理問題頁面。
站長規(guī)避:不要在移動網(wǎng)站中添加惡意代碼來獲取訪客手機號碼和隱私數(shù)據(jù)。不要使用非正常手段劫持百度流量,都將受到算法懲罰和打擊。
(9)、細雨算法
算法主旨:主要針對網(wǎng)站標題作弊的行為
算法詳情:2019年11月,百度搜索發(fā)布細雨算法2.0,針對B2B行業(yè)的惡劣違規(guī)問題及低質內容。包括網(wǎng)站標題作弊的行為、頁面正文內容中存在受益信息、惡劣違規(guī)內容、低質內容。
站長規(guī)避:正文內容不完整,頻繁穿插變形的受益方式,拼接內容、純采集內容、跨領域采集內容,圖片內容與文字描述不一致、圖片嵌入電話號碼、圖片質量極低影響閱讀體驗等。
(10)、勁風算法
算法主旨:惡劣聚合頁問題。
算法詳情:2020年2月,百度搜索技術團隊發(fā)現(xiàn),部分網(wǎng)站及智能小程序通過惡意構造聚合頁面內容來獲取搜索排名,獲得搜索用戶關注,上線勁風算法,控制惡意構造聚合頁面的問題對搜索用戶的影響。
站長規(guī)避:頁面內容與站點本身所屬領域不符,或站點無專注領域,多為采集拼湊內容;頁面內容與標題及頁面中標記的標簽不符;由網(wǎng)站搜索功能生成的靜態(tài)搜索結果頁;空短、無有效信息、失效的聚合頁。
(11)、極光算法
算法主旨:極光算法,倡導重視落地頁時間規(guī)范問題,打擊不符合規(guī)定的網(wǎng)站減少展現(xiàn)機會。
算法詳情:2018年5月底,百度搜索將上線極光算法,旨在倡導資源方重視網(wǎng)站落地頁時間規(guī)范。落地頁時間因子是百度搜索判斷網(wǎng)站收錄、展示、排序結果的重要參考依據(jù)。為了讓用戶獲得更滿意的搜索瀏覽體驗,我們將給予符合落地頁時間因子要求且時效性較高的網(wǎng)頁更多的收錄、展現(xiàn)機會,同時減少不符合規(guī)定的網(wǎng)站的展現(xiàn)機會。
站長規(guī)避:根據(jù)百度搜索落地頁時間因子規(guī)范文檔來規(guī)范網(wǎng)頁的具體產(chǎn)生時間,滿足搜索用戶的瀏覽體驗??梢缘玫礁嗟恼宫F(xiàn)機會。
(12)、清風算法
算法主旨:移動網(wǎng)站欺騙用戶下載的問題進行永久封禁,欺騙下載,惡意引導不相關的APP下載等進行降權懲罰。
算法詳情:5月上旬為移動網(wǎng)站推出清風算法2.0,對于欺騙用戶下載的問題進行永久封禁;嚴厲打擊欺騙下載,惡意引導不相關的APP下載,下載鏈接無效鏈接等。
站長規(guī)避:移動網(wǎng)站規(guī)范化,不要設置惡意APP下載,欺騙用戶下載鏈接等。
(13)、閃電算法
算法主旨:移動搜索頁面首屏加載非常慢(3秒及以上)的網(wǎng)頁將會被打壓。
算法詳情:10月初"閃電算法"上線,移動搜索頁面首屏加載時間將影響搜索排名。移動網(wǎng)頁首屏在2秒之內完成打開的,在移動搜索下將獲得提升頁面評價優(yōu)待,獲得流量傾斜;同時,在移動搜索頁面首屏加載非常慢(3秒及以上)的網(wǎng)頁將會被打壓。
站長規(guī)避:針對移動網(wǎng)站進行速度優(yōu)化;確保移動頁面首屏加載時間不超過3秒,超過3秒將影響搜索排名。
(14)、藍天算法
算法主旨:百度持續(xù)打擊新聞源售賣軟文、目錄行為。
算法描述:百度持續(xù)打擊新聞源售賣軟文、目錄行為,百度反作弊團隊發(fā)現(xiàn)部分新聞源站點售賣目錄,發(fā)布大量低質內容現(xiàn)象仍然存在,此舉嚴重違反新聞源規(guī)則,并影響用戶搜索體驗。針對此情況,百度推出"藍天算法",旨在嚴厲打擊新聞源售賣軟文、目錄行為,還用戶一片搜索藍天。
算法打擊:觸發(fā)"藍天算法"問題站點將被清理出新聞源,同時降低其在百度搜索系統(tǒng)中的評價,請其他新聞源站點盡早自查網(wǎng)站內容,有則改之無則加勉。
百度官方表態(tài):"藍天算法"全力打擊有損用戶體驗的行為,絕不手軟。
站長規(guī)避:切勿購買所謂高權重或門戶網(wǎng)站的目錄,遠離新聞行業(yè)軟文,也將對出售這類網(wǎng)站進行打擊。
(15)、冰桶算法
算法主旨:針對發(fā)布惡劣誘導類廣告的頁面進行打擊。
算法描述:我們發(fā)現(xiàn)部分網(wǎng)頁通過色情動圖、露骨文本、賭博等等吸引眼球的形態(tài)誘導用戶點擊非法廣告,為了改善用戶體驗以及引導行業(yè)生態(tài)向積極健康的方向發(fā)展,百度搜索再次升級冰桶算法,針對發(fā)布惡劣誘導類廣告的頁面進行打擊,降低其在百度搜索系統(tǒng)中的評價。在此提醒各位站長,請盡快下線惡劣的誘導類廣告,以免被策略命中影響網(wǎng)站排序。
所謂惡劣誘導類廣告,指的是通過色情動圖、色情導航、露骨文本、賭博等等吸引眼球的形態(tài)誘導用戶點擊非法廣告。包含且不限于,色情導航,色情動圖類,露骨文字類。觸犯"冰桶算法"的網(wǎng)站,百度會降低此類型的網(wǎng)站在百度搜索系統(tǒng)中的評價。
站長規(guī)避:網(wǎng)站不要投放惡劣誘導廣告,一些色情GIF,露骨文本和賭博等廣告內容信息。
2、谷歌搜索引擎算法
(1)、Google Panda熊貓算法
Google一直以來都相當看重用戶的體驗,為了確保用戶在使用谷歌搜索引擎時,都能獲得高質量的內容,于是在2011年發(fā)布了熊貓算法,目的是減少Google搜索引擎中內容農(nóng)場或低質量網(wǎng)站的存在。
熊貓演算法主要審查網(wǎng)頁內容是否出現(xiàn)以下情況:
1.內容薄弱:每個頁面的內容都非常少,內容幾乎和網(wǎng)頁沒有相關性,或內容相當少的網(wǎng)頁。
2.重復內容:站內出現(xiàn)多個頁面都是相同,或幾乎一樣的內容。
3.低質量的內容:缺乏深入資訊或缺乏具有建設性的內容,對用戶來說毫無價值的頁面。
4.內容農(nóng)場:網(wǎng)站內容來源通常都來自其他網(wǎng)站,非原創(chuàng)性內容。內容農(nóng)場的目的大多是大量生產(chǎn)內容,為的是提升該網(wǎng)站的SEO排名。
5.內容和關鍵詞相關性低:若網(wǎng)站設定SEO為核心關鍵詞,實際上網(wǎng)頁內容都是廣告,并沒有SEO相關資訊,這種情況就是內容和關鍵詞相關性低。
(2)、Google Penguin企鵝算法
外部鏈接是Google SEO的重要排名因素之一,為懲罰利用黑帽SEO手法排名的網(wǎng)站,Google在2012 年發(fā)布了企鵝算法。
不少黑帽SEO的做法是操縱外鏈,將鏈接大量指向同一個網(wǎng)站以提升SEO排名。但該網(wǎng)站和被鏈接的網(wǎng)站并不具有相關性,這種情況很容易被企鵝算法認定為惡意鏈接,且違反搜索引擎規(guī)則,接著受到懲罰。
若外部鏈接來源是低質量或內容不相關的網(wǎng)站,且這種外鏈數(shù)量相當大,可能會被企鵝算法視為是通過購買外鏈等操作。因此,若因商業(yè)合作或其他需求,需要建立外鏈時,將鏈接加上nofollow標簽,可以避免被Google視為惡意操縱鏈接。nofollow標簽的作用就是告訴Google此鏈接不必追蹤,因此這個鏈接也不會被計入投票。
(3)、Google Hummingbird蜂鳥算法
目前Google搜索引擎已經(jīng)不再只是針對關鍵詞本身來提供內容,還會從字里行間給你更精準的資訊。2013 年,蜂鳥算法誕生。蜂鳥算法針對用戶的搜索意圖進行更復雜的分析,甚至了解用戶口語化的搜索,就像人工智能一樣,讓用戶有更好的體驗,快速且精準地獲得自己想要的搜索結果。
蜂鳥算法相當于填補了低質量內容網(wǎng)站與SEO之間的灰色地帶,濫用關鍵詞或內容農(nóng)場將受到蜂鳥算法或其他算法的懲罰。然而,要符合蜂鳥算法,最簡單的方法是只要網(wǎng)站內容自然通順,口語化且容易閱讀,符合用戶閱讀習慣,使其獲得良好體驗的內容,自然可以獲得搜索流量,且頁面有機會出現(xiàn)在搜索結果頁的知識圖譜上!
(4)、TrustRank算法
TrustRank算法是基于鏈接關系的排名算法,其目的就是在互聯(lián)網(wǎng)中篩選出高質量的頁面。
(5)、BadRank算法
BadRank算法與TrustRank算法的工作原理相似,就是確定一些不可信的頁面,然后再通過頁面與不可信頁面之間的鏈接關系以及鏈接距離來計算頁面的不可信值,從而確定頁面是否是不可信的。
(6)、PageRank算法
谷歌PageRank是一種根據(jù)頁面之間的超鏈接計算的技術,谷歌用PageRank來體現(xiàn)頁面的相關性和重要性,這也是在搜索引擎優(yōu)化中經(jīng)常被用來評估頁面優(yōu)化效果的因素之一。
Google分數(shù)=(相關關鍵詞分數(shù)X0.3)+(域名權重X0.25)+(外鏈分數(shù)X0.25)+(用戶數(shù)據(jù)X0.1)+(內容質量分數(shù)X0.1)+(人工加分)-(自動或人工降分)。
從公式中我們可以清楚的知道,影響pagerank分數(shù)的因素依次是"相關關鍵詞"、"域名"、"外鏈"、"用戶數(shù)據(jù)"、"內容質量"以及"人工干預"六個方面。
(7)、HillTop算法
谷歌HillTop算法的指導思想與PagRank是一致的,都是通過頁面被鏈接的數(shù)量和質量來確定搜索結果的排序權重。但HillTop認為只計算來自具有相同主題的相關文檔的鏈接對于搜索者的價值會更大,即主題相關網(wǎng)頁之間的鏈接對于權重計算的貢獻比主題不相關的鏈接價值要更高。
五、搜索引擎算法的作用
1、分析用戶輸入的關鍵詞
理解關鍵詞的含義對于返回優(yōu)質結果至關重要。因此,為了找到包含相關信息的頁面,搜索引擎算法第一步就是分析搜索查詢中的關鍵詞的含義。
2、搜索相符內容
接下來,搜索引擎會尋找包含與相應查詢匹配的信息的網(wǎng)頁。搜索引擎算法會在索引中查詢搜索關鍵詞以找到適當?shù)木W(wǎng)頁,這些算法會分析相關關鍵詞在某個網(wǎng)頁上(不論是在標題中還是在正文中)的出現(xiàn)頻率和顯示位置。
3、為實用網(wǎng)頁排名
對于一項典型的查詢,含有可能相關信息的網(wǎng)頁會多達數(shù)千個甚至數(shù)百萬個。因此,為了幫助將最符合需求的網(wǎng)頁排在靠前的位置,搜索引擎算法會評估這些網(wǎng)頁的實用性。這些算法會分析數(shù)百種不同的因素,以盡力呈現(xiàn)網(wǎng)絡所能提供的最有用的信息。為了評估內容在相關主題方面的可信度和權威性,搜索引擎會尋找那些看起來在類似查詢中受到大量用戶青睞的網(wǎng)站。如果與該主題相關的其他知名網(wǎng)站鏈接到了相應頁面,則可充分說明搜索結果頁上的信息具有較高的品質。
4、返回最佳結果
在搜索引擎提供搜索結果之前,會評估所有相關信息的綜合效果,會根據(jù)用戶的搜索類型以最有用的格式提供一系列多樣的信息。
5、個性化匹配
搜索引擎會根據(jù)用戶的位置、過往搜索記錄和搜索設置等信息量身顯示最實用且最相關的結果。
總結
優(yōu)化猩SEO:搜索引擎算法是變化的,但搜索引擎的本質是提升用戶體驗,即為用戶提供最佳的搜索結果,網(wǎng)站優(yōu)化需要跟上搜索引擎算法的變化,還需要注重用戶體驗的提升,為用戶提供最佳的內容才會獲得更好的自然搜索排名。
參考鏈接:
搜索引擎算法_百度百科
https://baike.baidu.com/item/%E6%90%9C%E7%B4%A2%E5%BC%95%E6%93%8E%E7%AE%97%E6%B3%95/10116955
什么是Google算法?認識谷歌搜索引擎的3大算法-騰訊云
https://cloud.tencent.com/developer/article/1701758
Google 搜索的工作方式 _ 概覽
https://www.google.com/intl/zh-CN/search/howsearchworks/
修改于2023-06-24
想了解更多SEO百科的內容,請訪問:SEO百科