人妻丝袜美腿中文字幕乱一区三区-天天爽夜夜爽夜夜爽-摸 透 干 奶 流 操 逼-中文字幕一区二区色婷婷-免费特黄一级欧美大片在线看-91久久福利国产成人精品-久久精品人人爽人人做97-亚洲深喉一区二区在线看片-久久中文字幕无码不卡

搜索引擎工作的三大步驟 搜索引擎的工作原理及發(fā)展歷程


SEO(搜索引擎優(yōu)化)
SEO(搜索引擎優(yōu)化)通常定義為:在了解搜索引擎的工作原理基礎(chǔ)上,對(duì)網(wǎng)站進(jìn)行內(nèi)外調(diào)整優(yōu)化,提高網(wǎng)站關(guān)鍵詞排名,獲得更多流量,達(dá)成網(wǎng)站的營銷目的 。通過這一定義,我們可以看到,做SEO首先需要知道我們搜索引擎的工作原理是怎樣的,只有搞清楚它的原理,我們才可以本著這一原理進(jìn)行做后期優(yōu)化工作 。這就是今天這一期重點(diǎn)和大家分享的話題:搜索引擎的工作原理!
由于搜索引擎這一塊的專業(yè)知識(shí)涉及很廣,可以單獨(dú)作為一門學(xué)科來系統(tǒng)化學(xué)習(xí)的,所以建議新手剛開始學(xué)SEO的時(shí)候可以先多學(xué)習(xí)下搜索引擎這一塊知識(shí)哦,也可以自己買本搜索引擎原理的書籍看看也行,只有理解了搜索引擎的工作原理后,我們對(duì)后期優(yōu)化工作才有了明確的方向!
搜索引擎的工作原理
首先搜索引擎的工作原理大體上分為三個(gè)階段:

  1. 爬行與抓?。核阉饕嬷┲?Spider)通過跟蹤鏈接發(fā)現(xiàn)和訪問頁面,然后讀取HTML代碼,存入數(shù)據(jù)庫中;
  2. 預(yù)處理:搜索引擎蜘蛛抓取來的頁面數(shù)據(jù)進(jìn)行文字提取,中文分詞,索引(正向索引),倒排索引等,以備后面排名和展現(xiàn);
  3. 排名:通過一定的搜索相關(guān)性計(jì)算,按照一定格式生成搜索結(jié)果頁面 。

搜索引擎的工作原理
針對(duì)這三個(gè)階段詳細(xì)說下搜索引擎的工作原理:
爬行與抓取
1、跟蹤鏈接:一般是深度優(yōu)先和廣度優(yōu)先兩種跟蹤方式,如圖所示:
深度優(yōu)先跟蹤鏈接
廣度優(yōu)先跟蹤鏈接
理論上,無論是哪種跟蹤方式,只要給蜘蛛足夠多時(shí)間,都能爬完整個(gè)互聯(lián)網(wǎng)上的鏈接,但實(shí)際上,蜘蛛的寬帶資源和時(shí)間都是非常有限的,不可能爬完所有的鏈接,最多只能爬行和收錄一小部分,所以我們做SEO工作就需要主動(dòng)吸引蜘蛛來爬行和收錄我們的頁面 。
2、吸引蜘蛛:哪些頁面可以吸引到蜘蛛呢?符合以下幾點(diǎn)就足以 。
  • 第一,網(wǎng)站和頁面權(quán)重 。權(quán)重越高,蜘蛛就越喜歡,尤其是老網(wǎng)站,質(zhì)量高的網(wǎng)站;
  • 第二,頁面更新頻率 。蜘蛛喜歡新鮮事物,所以網(wǎng)站這一塊也需要經(jīng)常多跟新;
  • 第三,導(dǎo)入鏈接 。無論是外鏈還是內(nèi)鏈,只要多給蜘蛛爬行頁面的路徑,頁面收錄率和排名會(huì)更高;
  • 第四,與首頁點(diǎn)擊距離 。一般網(wǎng)站首頁權(quán)重最高,所以頁面里首頁的點(diǎn)擊距離越近,爬行和收錄機(jī)會(huì)更高;
  • 第五,URL結(jié)構(gòu) 。首先符合靜態(tài)化最好,其次URL越短,層次越少,蜘蛛爬行的機(jī)會(huì)就更大些,頁面收錄機(jī)會(huì)也就更大 。
預(yù)處理
這里所說的預(yù)處理包括:提取文字,中文分詞,去停止詞,消除噪聲,去重,正向索引,倒排索引,鏈接關(guān)系計(jì)算,特殊文件處理以及質(zhì)量判斷等等,由于內(nèi)容過多,這里不多做詳細(xì)說明,主要講下正向索引和倒排索引這兩塊核心內(nèi)容,有些書籍把預(yù)處理這一階段定義為索引,其實(shí)也是說明了正向索引和倒排索引的重點(diǎn),首先看下面示意圖:
正向索引結(jié)構(gòu)
倒排索引結(jié)構(gòu)
上圖中文件就是指頁面了,關(guān)鍵詞就是與用戶所搜索的詞相匹配的關(guān)鍵詞,這里的關(guān)鍵詞是搜索引擎內(nèi)部存儲(chǔ)的關(guān)鍵詞,也是基于過去用戶所搜索過的詞,進(jìn)行一次收集和整理所得出來的 。通過對(duì)比兩種索引結(jié)構(gòu)就可以看出,倒排索引更能符合搜索引擎的工作要求,當(dāng)用戶搜索某一關(guān)鍵詞時(shí)候,搜索引擎系統(tǒng)內(nèi)部便能一次性直接導(dǎo)出與關(guān)鍵詞相匹配的頁面,然后再通過鏈接相關(guān)性計(jì)算,特殊文件處理,頁面質(zhì)量判斷得出哪些頁面可以用作搜索結(jié)果頁面中,最后以排名的方式顯示出來 。
排名
【搜索引擎工作的三大步驟 搜索引擎的工作原理及發(fā)展歷程】 進(jìn)行預(yù)處理過后,尤其是倒排索引處理之后,然后對(duì)用戶搜索詞處理以及相應(yīng)的文件匹配,得出初始文件的子集,這里的初始文件子集并不能直接用于排名,還要進(jìn)行相關(guān)性計(jì)算,排名過濾和調(diào)整,最終顯示出頁面的排名結(jié)果 。這里的相關(guān)性計(jì)算,主要是根據(jù)關(guān)鍵詞常用程度、詞頻和密度、關(guān)鍵詞位置及形式、關(guān)鍵詞距離、鏈接分析及頁面權(quán)重等來得出頁面的內(nèi)容是否和用戶搜索的詞高度相關(guān) 。
-- 展開閱讀全文 --

    推薦閱讀