av蓝导航精品导航_国产精品69久久久久水密桃_超碰成人免费_国产精品调教视频

robots.txt概念和10條注意事項

robots.txt概念

如果我們網站內有某些特殊的文件不讓搜索引擎收錄,那怎么辦?

答案是:使用一個叫做robots.txt的文件。

robots.txt文件告訴搜索引擎本網站哪些文件是允許搜索引擎蜘蛛抓取,哪些不允許抓取。

搜索引擎蜘蛛訪問網站任何文件之前,需先訪問robots.txt文件,然后抓取robots.txt文件允許的路徑,跳過其禁止的路徑。

總結:robots.txt是一個簡單的.txt文件,用以告訴搜索引擎哪些網頁可以收錄,哪些不允許收錄。


關于robots.txt文件的10條注意事項:

1、如果未創建robots.txt文件,則代表默認網站所有文件向所有搜索引擎開放爬取。

2、必須命名為:robots.txt,都是小寫,robot后面加"s"。

3、robots.txt必須放置在一個站點的根目錄下。

     通過如http://www.68aass.com/robots.txt 可以成功訪問到,則說明本站的放置正確。

4、一般情況下,robots.txt里只寫著兩個函數:User-agent和 Disallow。

5、空格換行等不能弄錯,可復制這個頁面并修改為自己的。點擊

6、有幾個禁止,就得有幾個Disallow函數,并分行描述。

7、至少要有一個Disallow函數,如果都允許收錄,則寫: Disallow: 

    如果都不允許收錄,則寫:Disallow: /  (注:只是差一個斜桿)。

8、允許有多個User-agent,如果對所有爬取蜘蛛生效,則用“*”星號表示。

9、robtos.txt文件內可以放上Sitemap文件地址,方便告訴搜索引擎Sitemap文件地址。

10、網站運營過程中,可以根據情況對robots.txt文件進行更新,屏蔽一些不要搜索引擎抓取的文件地址。


舉例兩個常見屏蔽規則:

User-agent: *  星號說明允許所有搜索引擎收錄

Disallow: /search.html   說明 http://www.68aass.com/search.html 這個頁面禁止搜索引擎抓取。

Disallow: /index.php?   說明類似這樣的頁面http://www.68aass.com/index.php?search=%E5%A5%BD&action=search&searchcategory=%25 禁止搜索引擎抓取。


擴展閱讀:

robots.txt文件用法規范百度官方資料截圖版

這里的每個問題都曾卡住某一位同學很長時間,我們整理出來方便更多同學,如發現Bug,歡迎通過客服微信反饋。

夫唯于2024年12月停止百度SEO研究和培訓。道別信: 夫唯:再見了百度SEO!

2025年1月正式啟動Google SEO培訓課程,一千零一夜帶領大家一起出海。

感興趣的同學,請添加招生客服小沫微信:seowhy2021。 微信掃碼添加客服人員

主站蜘蛛池模板: 本溪市| 和顺县| 朝阳市| 婺源县| 广西| 辽中县| 靖安县| 荆州市| 香港 | 布尔津县| 昌平区| 磐安县| 巴彦淖尔市| 平泉县| 安乡县| 舒兰市| 达日县| 上饶市| 山东省| 林芝县| 肃南| 大石桥市| 安康市| 丹寨县| 林周县| 灵川县| 越西县| 安阳市| 芮城县| 霍邱县| 万宁市| 额济纳旗| 泸溪县| 汾西县| 宁化县| 阳朔县| 宜昌市| 永嘉县| 贡山| 同德县| 宁陵县|
Processed in 0.140488 Second , 35 querys.