编辑:卢龙新城建站 关注: 时间:2019-12-20 14:09:43
温馨提示:专业网站建设、小程序制作、APP开发,尽在新城建站,详询 15544599750(手机、微信、QQ同号)
文前导读:
做网站优化的站长们都知道,robots文件一般存放于网站的根目录下,用来告诉搜索引擎蜘蛛此网站中的哪些内容是可以被搜索引擎建立索引的,哪些文件是不能建立索引的。因此,robots文件作为网站与搜索引擎蜘蛛“交流”的重要通道。
值得注意的是,当网站包含不希望被搜索引擎收录的内容时,才需要使用robots.txt文件。如果您希望搜索引擎收录网站上所有内容,是不需要建立robots文件的。那么robot文件如何书写才是正确的呢?以搁浅seo博客为例,给大家介绍下robots的书写方法。
如上图所示:User-agent:* 该项值用于描述搜索引擎robot的名字。*是一个通配符,代表的所有的搜索引擎。
Disallow:/wp-admin/ 定义是禁止爬寻wp-admin目录下面的目录
Disallow:/*?* 禁止访问网站中所有包含问号 (?) 的网址
Disallow:/tag 定义是禁止爬寻tag的整个目录
Disallow:/wp-config.php 定义的是禁止爬取根目录下面的wp-config.php文件
那么允许搜索引擎蜘蛛爬取网站的文件怎么写呢?比如允许爬取about的整个目录,则可以写成Allow: /about
经常逛淘宝的朋友会发现,淘宝网站屏蔽许百度蜘蛛抓取网站,所以robots文件写成User-agent: baiduspider Disallow:/。还有的网站robots文件写成User-agent:* Disallow:/ 如下图所示,这样写的话,则会禁止所有搜索引擎抓取。如果此网站要做优化的话,记得及时去掉。
拓展阅读:
卢龙网站推广谈互联网“黑色五月”:网易、支付宝、携程宕机拷问
本文由新城建站整理发布,喜欢请收藏,转载请保留链接 卢龙建站分享详细介绍网站根目录放置robots文件的作用https://www.nccpu.net/lulong/32811.html