搜索引擎优化(SEO)学院

首页 | 长江三峡旅游 | SEO学院 | SEO资料 | SHOP | 学院地图 | 服务承诺 | RSS
搜索引擎

控制搜索机器人抓取的robots.txt

搜索引擎都有自己的“搜索机器人”(ROBOTS),并通过这些ROBOTS在网络上沿着网页上的链接(一般是http和src链接)不断抓取资料建立自己的数据库。 对于网站管理者和内容提供者来说,有时候会有一些站点内容,不希望被ROBOTS抓取而公开。为了解决这个问题,ROBOTS开发界提供了两个办法:一个是robots.txt,另一个是The Robots META标签

robots.txt是一个纯文本文件,通过在这个文件中声明该网站中不想被robots访问的部分,这样,该网站的部分全部内容就可以不被搜索引擎收录了,或者指定搜索引擎只收录指定的内容。 当一个搜索机器人访问一个站点时,它会首先检查该站点根目录下是否存在robots.txt,如果找到,搜索机器人就会按照该文件中的内容来确定访问的范围,如果该文件不存在,那么搜索机器人就沿着链接抓取

robots.txt必须放置在一个站点的根目录下,而且文件名必须全部小写。

http://www.robotstxt.org/

控制搜索机器人抓取的robots.txt
搜索引擎优化(SEO)学院内相关文章
• 网上品牌承诺和设计
• SEO有必要对行业知识进行了解
• 登录搜索引擎的好处
• 从豆瓣网douban.com再谈网站的重构
• 伟大企业都在危机中成长
• SEO解惑:网站优化与SEO一样吗
• 百度:改盈利模式或受技术局限
• SEO尼玛都成艺术了
• 应该给百度找一个老师
• 中小型网站运营策略
©2008 搜索引擎优化(SEO)学院
搜索引擎优化 SEO Feed Sky