网球少年主题曲|网球直播188
【沈陽網絡公司選曉天科技】五大營銷型網站推廣系統為您打造:沈陽網站制作,沈陽網站建設,沈陽網站優化,沈陽網絡推廣第一品牌!【萬客寶】
15998287373

想讓企業在互聯網上做得更好的企業家的不二之選!

實戰 專業 落地 高效??

您現在的位置:主頁 > 新聞資訊 > 沈陽網站優化 >

沈陽-SEO從業者必須了解的搜索引擎工作原理

人氣: 發表時間:2018-12-07 作者:沈陽seo公司


搜索引擎(search engine)工作原理一個SEO從業者應該了解(Find out)的基礎課程,但是有人卻說搜索引擎工作原理對于新手來說是不容易理解的,因為工作原理太抽象,而且搜索引擎的變化無常,無論誰都不能真正認識搜索工作原理。
我想說的是無論搜索引擎(search engine)怎樣變化,大概的收錄原理是不會變的:
1、找到網站的URL并下載頁面。
2、判斷頁面質量是否達到收錄標準收錄頁面,否則刪除。
3、判斷收錄頁面(webpage)是否更新,更新頁面快照。
以上三條是搜索引擎(Engine)收錄頁面基本的規律,無論百度(BIDU)還是谷歌都不會違背。那么我們就可以以以上三條作為依據詳細(xiáng xì)的解釋一下搜索引擎的工作原理(基本的規律)。
首先搜索引擎的組成(composition):
圖1
如圖1所示:搜索引擎可以分為基本的五大部分,既抓取網頁系統,數據分析系統,存儲數據系統,緩存系統,展示系統。沈陽百度快照是百度針對用戶數據搜索時比較友好且使用的功能。如果無法打開某個搜索結果,或者打開速度特別慢,該怎么辦?“百度快照”能幫您解決問題。每個被收錄的網頁,在百度上都存有一個純文本的備份,稱為“百度快照”。
1、抓取網頁系統:分為探測系統和下載系統,探測系統就是我們平常說的蜘蛛(baiduspider),蜘蛛在互聯網上爬行時探測到一個網站的URL,就會把URL所指向的頁面利用下載系統,下載到搜索引擎(search engine)的服務器上,然后將頁面交給數據分析系統。
2、數據分析(Data Analysis)系統:分為數據分析和數據處理兩個系統,當數據分析系統從抓取網頁系統那獲取到被下載的頁面(webpage),首先進行數據分析去除不相關的文字或網站重復網站內容,進行頁面文字的處理,然后對處理過后的頁面內容進行判斷,是否達到收錄標準,達到交給存儲系統,沒有達到刪除。
3、存儲數據系統:將收錄的頁面進行保存,然后定時進行判斷存儲的頁面是否有更新。沈陽網站優化可以從狹義或者廣義兩個方面來說明,網站優化是對網站進行程序、域名注冊查詢、內容、版塊、布局等多方面的優化調整,也就是網站設計時適合搜索引擎檢索,滿足搜索引擎排名的指標,從而在搜索引擎檢索中獲得流量排名靠前,增強搜索引擎營銷的效果使網站的產品相關的關鍵詞能有好的排位。
4、緩存(cache)系統:存儲搜索引擎認為高價值(value)的內容,當用戶搜索某個關鍵詞時常常看到收錄量有幾千萬,但是搜索引擎顯示的只有1000條,這也就是說只有1000條被放在了緩存系統上,用戶可以最快速的查找到他們想要的內容。
5、展示系統:用戶搜索返回到顯示器上的信息。
這是搜索引擎(Engine)的系統(system)的組成(composition),那么一個頁面(webpage)是如何被搜索引擎發現并收錄的呢???
圖2
圖2,蜘蛛在整個互聯網上爬行遇見你網站的一個URL,首先把URL提取出來根據網站權重和相關(related)性插入到URL隊列中,然后是判斷你網站的這條URL是否可以解析成功,如果能解析成功,蜘蛛會爬到你網站,這里需要說一下,蜘蛛并不是直接去分析你網頁的內容,而是去尋找你網站robots文件,根據你網站的robots規則判斷是否抓取你這個頁面,如果robots文件不存在,則會返回一個404錯誤,但是搜索(search)引擎已經會繼續抓取你的網站內容。
搜索引擎抓取了網頁內容之后會對網頁進行一個簡單的判斷是否達到了收錄標準,如果不符合則繼續把URL加入到URL 隊列中,如果符合收錄就會下載網頁內容。沈陽網站優化可以從狹義或者廣義兩個方面來說明,網站優化是對網站進行程序、域名注冊查詢、內容、版塊、布局等多方面的優化調整,也就是網站設計時適合搜索引擎檢索,滿足搜索引擎排名的指標,從而在搜索引擎檢索中獲得流量排名靠前,增強搜索引擎營銷的效果使網站的產品相關的關鍵詞能有好的排位。
當搜索(search)引擎拿到下載網頁網站內容的時候,會提取出頁面(webpage)上的URL,繼續插入到URL隊列中,然后把頁面上的數據,進行進一步分析,判斷網頁內容是否達到收錄標準,如果達到收錄標準則把頁面存儲到硬盤中。
當用戶搜索某個關鍵(解釋:比喻事物的重要組成部分)詞時,搜索引擎為了減少查詢時間,將一部分相關性比較高的網站內容放到臨時緩存區,大家都知道從計算機的緩存中讀取數據,比在硬盤中讀取數據快很多。所以搜索引擎只將緩存中的一部分顯示給用戶。被存儲在硬盤中的頁面,搜索引擎會根據網站權重定時對其進判斷是否有更新,是否達到了放入緩存區的標準,如果搜索引擎在判斷是否有更新的同時發現網站頁面被刪除或網頁達不到被收錄的標準也會被刪除。
以上就是搜索引擎的組成和頁面收錄原理,希望每一位seo人員都應掌握(熟知并能運用) 。