Sitemap.xml是google搞出來的,也就是網(wǎng)站地圖,不過這個(gè)網(wǎng)站地圖是用xml寫的,而且要按google的標(biāo)準(zhǔn)來寫,并且要將寫出 來的這個(gè)文件sitemap.xml上傳到自己的服務(wù)器空間中去。目前,Google, Yahoo, MSN都已經(jīng)聲明支持這種格式,Baidu還沒有聲明支持,但估計(jì)走這一步也是大勢所趨。這將是向眾多搜索引擎提供你網(wǎng)站信息的一種很好的方法。
提交sitemap一是有利于搜索抓取一些正常抓取過程中無法抓取的網(wǎng)址,比如動(dòng)態(tài)網(wǎng)頁,包含大量AJAX的網(wǎng)頁或者flash的頁面。二是為搜索蜘蛛指 明“工作方向”。Sitemap就是你網(wǎng)站上頁面的列表,googlebot就按照這個(gè)去一個(gè)個(gè)的抓取收錄頁面,顯然比它自己去找會(huì)效率高,而且要全。 Google網(wǎng)站上有完整的關(guān)于sitemap.xml的詳細(xì)說明:
但很多站長看后仍然不會(huì)操作,下面這個(gè)教程就是手把手教會(huì)你創(chuàng)建Sitemap.xml。
<!--[if !supportLists]-->1. <!--[endif]-->Sitemap.XML 的格式
完整格式如下:
2008-07-17
daily
1.0
2008-07-17
weekly
0.9
…
…
下面,對以上標(biāo)簽分別加以解釋
<!--[if !supportLists]-->a) <!--[endif]-->
這兩行就相當(dāng)于網(wǎng)頁文件中的標(biāo)簽一樣的作用。不必管這兩行什么意思,照抄即可。
切記:一個(gè)字符也不能錯(cuò),即使多一個(gè)空格,google網(wǎng)站采集時(shí)也會(huì)報(bào)錯(cuò)。另外,千萬別忘了在文件的末尾加上標(biāo) 簽。
<!--[if !supportLists]-->
b) url:每個(gè)標(biāo)簽包含一個(gè)網(wǎng)頁地址,是以下標(biāo)簽的父標(biāo)簽。
c)
這里是頁面鏈接地址,也就是你希望蜘蛛訪問的地址。
切記:在地址中出現(xiàn)的某些特殊字符需要使用轉(zhuǎn)義字符,否則,google也會(huì)報(bào)錯(cuò)。最典型的就是 & 號,經(jīng)常在動(dòng)態(tài)網(wǎng)址中出現(xiàn),在提交地址中必須寫成 & 如:提交,google管理員工具就會(huì) 報(bào)錯(cuò),而改為 提交后就沒有問題了。我看到網(wǎng)上有人說 sitemap.xml只能提交一個(gè)參數(shù)的網(wǎng)頁的說法,其實(shí)多半是因?yàn)闆]有使用轉(zhuǎn)義字符而導(dǎo)致出錯(cuò)的。其他的轉(zhuǎn)義字符就不一一列出了,大家可以在網(wǎng)上查。
d) lastmod:頁面最后修改時(shí)間
這個(gè)很重要。Google的機(jī)器人會(huì)在索引此鏈接前先和上次索引記錄的最后更新時(shí)間進(jìn)行 比較,如果時(shí)間一樣就會(huì)跳過不再索引。所以如果你的鏈接內(nèi)容基于上次Google索引時(shí)的內(nèi)容有所改變,應(yīng)該更新該時(shí)間,讓Google下次索引時(shí)會(huì)重新 對該鏈接內(nèi)容進(jìn)行分析和提取關(guān)鍵字。這里必須用ISO 8601中指定的時(shí)間格式進(jìn)行描述,格式化的時(shí)間格式如下:
年:YYYY(2008)
年和月:YYYY-MM(2008-06)
年月日:YYYY-MM-DD(2008-06-04)
年月日小時(shí)分鐘:YYYY-MM-DDThh:mmTZD(2008-06-04T10:37+08:00)
年月日小時(shí)分鐘秒:YYYY-MM-DDThh:mmTZD(2008-06-04T10:37:30+08:00)
這里需注意的是TZD,TZD指定就是本地時(shí)間區(qū)域標(biāo)記,像中國就是+08:00了
切記:其他格式可能引起出錯(cuò),比如將2008-08-08 寫成2008-8-8就會(huì)出問題。
e) changefreq:頁面內(nèi)容更新頻率。
這里可以用來描述的單詞共這幾個(gè):"always", "hourly", "daily", "weekly", "monthly", "yearly",具體含義我就不用解釋了吧,光看單詞的意思就明白了。
f) priority:相對于其他頁面的優(yōu)先權(quán)
定于0.0 - 1.0之間 。
切記:建議將各類網(wǎng)頁根據(jù)重要性給出不同的數(shù)值,以方便蜘蛛的采集,不要耍小聰明全部寫1.0,google管理工具會(huì)報(bào)錯(cuò)的。
2. Sitemap.xml制作方式
制作方式無非兩種,自動(dòng)方式和手動(dòng)方式。
自動(dòng)方式一般使用生成工具自動(dòng)生成,只需輸入自己的網(wǎng)址,就可以得到完整的xml文件。這種方式一般適用于靜態(tài)網(wǎng)站,在此不再贅述。但需要提醒的 是,網(wǎng)上的工具良莠不齊,生成的文件經(jīng)常有錯(cuò)誤,不一定能通過google的校驗(yàn),使用者需認(rèn)真辨別。
手工方式則是由站長手工填寫或?qū)懗绦蛲瓿删?,代碼很簡單,大家可以到網(wǎng)上查找。
3. 提交
Sitemap.xml制作完成后,就需要將xml文件提交到相關(guān)搜索引擎。
Google提交網(wǎng)址:
Yahoo提交網(wǎng)址:
提交后,一般在幾個(gè)小時(shí)之內(nèi),系統(tǒng)就開始下載處理了。
4. Sitemap.xml的校驗(yàn)
至于你的網(wǎng)站地圖是否符合標(biāo)準(zhǔn),最方便的手段就是使用google的管理員工具了。
在他下載你的sitemap.xml后幾天內(nèi),這個(gè)工具就會(huì)將詳細(xì)的分析結(jié)果反饋回來,包括:sitemap.xml中包含了多少地 址,google已將多少地址加入索引,sitemap.xml中出現(xiàn)了哪些錯(cuò)誤,甚至蜘蛛采集過程中遇到的各種問題,比如哪些網(wǎng)頁有404,500錯(cuò)誤 都會(huì)詳細(xì)的羅列出來,非常方便。
如果你提交的xml文件一切無誤,那么接下來,你就是等著讓它的搜索蜘蛛來爬了,sitemap的文件告知了文件更新的頻率,這樣搜索蜘蛛來得更勤 快,頁面被收錄當(dāng)然也就更快。
SEO專題推薦:
關(guān)鍵詞優(yōu)化專題:網(wǎng)站關(guān)鍵詞優(yōu)化沒效果?來這里學(xué)習(xí)最實(shí)用的關(guān)鍵詞優(yōu)化技巧!
內(nèi)鏈優(yōu)化專題:最能提升網(wǎng)站權(quán)重的內(nèi)鏈部署優(yōu)化技巧與方法
外鏈建設(shè)專題:高質(zhì)量自然外鏈怎么做?讀完這些你將質(zhì)的飛躍
網(wǎng)站降權(quán)專題:2015年最有用的網(wǎng)站降權(quán)、被K、被黑、被攻擊的解決方法
用戶體驗(yàn)專題:學(xué)習(xí)完這些,作為站長的你可以秒懂如何做網(wǎng)站用戶體驗(yàn)
行業(yè)網(wǎng)站專題:優(yōu)化行業(yè)網(wǎng)站的“葵花寶典”看完后無優(yōu)化壓力
申請創(chuàng)業(yè)報(bào)道,分享創(chuàng)業(yè)好點(diǎn)子。點(diǎn)擊此處,共同探討創(chuàng)業(yè)新機(jī)遇!