搜索引擎的基本工作流程: 抓取網(wǎng)絡(luò)頁(yè)面-預(yù)處理-查詢(xún)服務(wù) 。本篇講講如何根據(jù)這三個(gè)流程來(lái)優(yōu)化自己的網(wǎng)站,從而獲得免費(fèi)的流量。
1. 抓取網(wǎng)絡(luò)頁(yè)面
搜索引擎抓取頁(yè)面就是大家常說(shuō)的蜘蛛(有的地方也叫機(jī)器人)抓取。搜索引擎的一個(gè)自動(dòng)應(yīng)用程序,它的作用是在互聯(lián)網(wǎng)中瀏覽信息,然后把這些信息都抓取到搜索引擎的服務(wù)器上。簡(jiǎn)單理解:我們可以把 搜索引擎蜘蛛當(dāng)作一個(gè)用戶,然后這個(gè)用戶來(lái)訪問(wèn)我們的網(wǎng)站,然后在把我們網(wǎng)站的內(nèi)容保存到自己的電腦上 !下面說(shuō)說(shuō)兩個(gè)蜘蛛的“習(xí)慣”:
△ 蜘蛛抓取頁(yè)面流程 : 發(fā)現(xiàn)鏈接-下載鏈接內(nèi)容-保存-取內(nèi)容中的鏈接-循環(huán)。
△ 蜘蛛抓取頁(yè)面規(guī)律 : 深度優(yōu)先,寬度優(yōu)先,重訪優(yōu)先,權(quán)重優(yōu)先。
? 優(yōu)化項(xiàng) :
1. 提 交鏈接 :直接通過(guò)提交網(wǎng)址到引擎的方法讓蜘蛛知道我們的網(wǎng)站。這樣可以節(jié)約蜘蛛到我們網(wǎng)站的時(shí)間。
2. 做好 內(nèi)鏈 :主要是導(dǎo)航,次導(dǎo)航與面包屑導(dǎo)航,頁(yè)面內(nèi)容鏈接,需要清晰分布。方便蜘蛛快速抓取網(wǎng)站上的所有頁(yè)面。
3. URL層次不要太深 :這個(gè)針對(duì)上面深度優(yōu)化與寬度優(yōu)化,URL目錄越深,蜘蛛越難爬到這個(gè)頁(yè)面。
4. 做好的外鏈 :主要是蜘蛛喜歡去權(quán)重高的頁(yè)面上抓取鏈接,假如我們?cè)诰W(wǎng)易首頁(yè)上做友情鏈接,那蜘蛛就會(huì)很快到我們頁(yè)面上來(lái),并給予較好評(píng)價(jià)。這是針對(duì)上面權(quán)重優(yōu)先。
5. 網(wǎng)站更新 :這里需要提到重訪優(yōu)先,比如前一天蜘蛛來(lái)抓取了我們的網(wǎng)頁(yè)內(nèi)容,而今天我們?cè)谠擁?yè)面又增加了新的內(nèi)容,那蜘蛛就回來(lái)抓取新的內(nèi)容。長(zhǎng)此以往,網(wǎng)站在蜘蛛的“印象”中就很友好了。
2. 預(yù)處理
預(yù)處理,又稱(chēng)為索引。我們知道搜索引擎蜘蛛在 爬行頁(yè)面之后會(huì)對(duì)該頁(yè)面進(jìn)行提取文字信息,分詞,去噪,去重,得到一批關(guān)鍵詞集合 。之后搜索引擎會(huì)對(duì)這個(gè)集合進(jìn)行 正向索引 ,即把每個(gè)頁(yè)面中的多個(gè)關(guān)鍵詞和頁(yè)面建立對(duì)應(yīng)關(guān)系,同時(shí)會(huì) 記錄 這些關(guān)鍵詞的密度,頻率,表現(xiàn)格式等權(quán)重信息。表現(xiàn)格式主要是分析這些關(guān)鍵詞是否使用了H1標(biāo)簽,是否使用了粗體或顏色變化,是否出現(xiàn)在了頁(yè)面的title,description,keywords標(biāo)簽等權(quán)重標(biāo)簽。
? 優(yōu)化項(xiàng) :
1. 代碼簡(jiǎn)潔 :提取文字信息主要是去除HTML、CSS、JavaScript、Flash、圖片等代碼及資源。簡(jiǎn)潔代碼可以幫引擎節(jié)省時(shí)間。
2. 關(guān)鍵詞要集中 :舉例,如果網(wǎng)站是要做“中國(guó)瓷器”這個(gè)關(guān)鍵詞,不要描述“中國(guó)的瓷器”,因?yàn)榻?jīng)過(guò)分詞,去噪后,中國(guó)的瓷器,就變成兩個(gè)詞:中國(guó) 瓷器,“的”已經(jīng)消除了。引擎上搜索“中國(guó)瓷器”評(píng)定頁(yè)面相關(guān)時(shí),中國(guó)瓷器描述一定比中國(guó)的瓷器要高。
3. 頁(yè)面相似度不能太高 :上面引擎的去重操作,會(huì)取消相似度高的頁(yè)面的保存。
4. 關(guān)鍵字密度 :引擎建議2%-8%,太少就會(huì)缺少相關(guān)性。
5. H標(biāo)簽的運(yùn)用 :H1用于網(wǎng)站唯一主標(biāo)題,只用一次,大多用于資訊新聞文章的標(biāo)題。H2,H3用于分類(lèi)標(biāo)題,可用多次。
6. 粗體 :粗體有兩種b和 strong,b主要側(cè)重于表現(xiàn)視覺(jué)上的強(qiáng)調(diào),而strong則是指語(yǔ)意上的強(qiáng)調(diào)。一般用于優(yōu)化關(guān)鍵字的話,是用strong。
7. 顏 :顏色也可強(qiáng)調(diào)關(guān)鍵字。
8. title,description,keywords :這三個(gè)標(biāo)簽是引擎第一關(guān)注點(diǎn)。主要關(guān)鍵字要合理分布在這三個(gè)標(biāo)簽中。
3 . 查詢(xún)服務(wù)
查詢(xún)服務(wù)就是最后的排名,當(dāng)用戶查詢(xún)關(guān)鍵字后,引擎對(duì)應(yīng)的查詢(xún)過(guò)程。首先把用戶搜索的內(nèi)容切分為一個(gè)關(guān)鍵詞序列,我們有了搜索詞集合,再把關(guān)鍵詞所對(duì)應(yīng)索引庫(kù),計(jì)算相關(guān)性后顯示。顯示結(jié)果: title與description 。
? 優(yōu)化項(xiàng) :
1. title的吸引性 :用戶搜索關(guān)鍵字后,發(fā)現(xiàn)你的網(wǎng)站排名很靠前,但是你的網(wǎng)站標(biāo)題是否吸引他去點(diǎn)擊,這是個(gè)問(wèn)題。
2. description的描述性 :Description要把網(wǎng)站的大致內(nèi)容描述清楚,讓用戶覺(jué)得這個(gè)網(wǎng)站可信。
總結(jié):根據(jù)搜 索 引擎的工作流程,對(duì)應(yīng)做出友好的行為 ,才能使網(wǎng)站滿足搜索引擎收錄排名需求。當(dāng)網(wǎng)站在搜索引擎中 提高關(guān)鍵詞排名 ,就能精準(zhǔn)地把用戶帶到網(wǎng)站,獲得 免費(fèi)流量 ,產(chǎn)生直接銷(xiāo)售或品牌推廣。
文章轉(zhuǎn)載請(qǐng)保留網(wǎng)址:http://waterplane.cn/news/solutions/1688.html