Sitemap Rss
·您当前位置:网站首页 >> SEO推广 >> 阅读文章

如何查看IIS日志及常见蜘蛛名称和标志

来源:逍遥峡谷 发布时间:2010-11-13 浏览0条评论
内容简介

通过查看IIS日志,我们可以知道有哪些蜘蛛爬行了我们的网站以及访问了哪些页面等等,下面介绍一下常见的一些主流的蜘蛛的名称和标志,并详细介绍不同的状态码代表什么。 1.谷歌Google蜘蛛 Googlebot Googlebot-Mobile Googlebot-Image Mediapartners-Google Adsbot-Google 2.百度(Baidu)蜘蛛 Baiduspider 3.雅虎(Yahoo)蜘蛛 Yahoo!+Slurp Yahoo!+Slurp+China:雅虎中国蜘蛛 4.有道(Yodao)蜘蛛 YodaoBot YoudaoBot YodaoBot-Image 5.搜搜(Soso)蜘蛛 Sosospider Sosoimagespider 6.微软(Bing和MSN)蜘蛛 bingbot msnbot msnbot-media 7.搜狗(Sogou)蜘蛛 Sogou Web Sprider Sogou Orion spider Sogou-Test-Spider

相关关键词:百度蜘蛛   Google蜘蛛   谷歌蜘蛛   必应蜘蛛   雅虎蜘蛛   Yahoo蜘蛛  

本文链接:http://www.icoa.cn/a/405.html [复制网址]

通过查看IIS日志,我们可以知道有哪些蜘蛛爬行了我们的网站以及访问了哪些页面等等,下面介绍一下常见的一些主流的蜘蛛的名称和标志,并详细介绍不同的状态码代表什么。

常见网络蜘蛛名称和标志:

1. 谷歌Google蜘蛛

1) Googlebot:从Google的网站索引和新闻索引中抓取网页

2) Googlebot-Mobile:针对Google的移动索引抓取网页

3) Googlebot-Image:针对Google的图片索引抓取网页

4) Mediapartners-Google:抓取网页确定 AdSense 的内容。只有在你的网站上展示 AdSense 广告的情况下,Google才会使用此漫游器来抓取您的网站。

5) Adsbot-Google:抓取网页来衡量 AdWords 目标网页的质量。只有在你使用 Google AdWords 为你的网站做广告的情况下,Google才会使用此漫游器。

2. 百度(Baidu)蜘蛛名称:Baiduspider

3. 雅虎(Yahoo)蜘蛛

1) Yahoo!+Slurp:雅虎总站蜘蛛

2) Yahoo!+Slurp+China:雅虎中国蜘蛛

4. 有道(Yodao)蜘蛛

1) YodaoBot:有道蜘蛛

2) YoudaoBot:有道蜘蛛

3) YodaoBot-Image:有道图片蜘蛛

5. 搜搜(Soso)蜘蛛

1) Sosospider:搜搜蜘蛛

2) Sosoimagespider:搜搜图片蜘蛛

6. 微软(Bing和MSN)蜘蛛

1) bingbot:必应蜘蛛

2) msnbot:MSN蜘蛛,这个蜘蛛只在我的网站爬行了robots.txt

3) msnbot-media:MSN蜘蛛

7.搜狗(Sogou)蜘蛛

1) Sogou Web Sprider:搜狗网页蜘蛛

2) Sogou Orion spider:搜狗蜘蛛

3) Sogou-Test-Spider:这个搜狗蜘蛛不知道是干什么的?不过我的站被搜狗降权了,所以只有这个蜘蛛爬行过,也就是说检测是否作弊的蜘蛛?

上面是主流的常见的一些蜘蛛,下面看一条蜘蛛爬行的记录吧:

2010-10-27 16:03:09 123.125.71.41 - GET /design_net/index.asp 200 0 HTTP/1.1 Baiduspider+(+http://www.baidu.com/search/spider.htm) -

爬行记录是用空格来隔开每个参数的,它们分别代表:日期 时间 来访IP 用户 方式 受访地址 状态 字节数 HTTP版本 客户端 来访地址。

上面这条蜘蛛访问记录指的是:在2010-10-27日16:03:09时间访问了/design_net/index.asp页面,来访的客户端是百度蜘蛛(Baiduspider+(+http://www.baidu.com/search/spider.htm)),状态是请求已完成(200)。

下面解释一下状态代码比如200等分别代表什么意思:

2xx 表示请求成功

200 正常;代表请求已完成。

201 正常;紧接 POST 命令。

202 正常;已接受用于处理,但处理尚未完成。

203 正常;部分信息 — 返回的信息只是一部分。

204 正常;无响应 — 已接收请求,但不存在要回送的信息。

3xx 重定向

301 已移动 — 请求的数据具有新的位置且更改是永久的。

302 已找到 — 请求的数据临时具有不同 URI。

303 请参阅其它 — 可在另一 URI 下找到对请求的响应,且应使用 GET 方法检索此响应。

304 未修改 — 未按预期修改文档。

305 使用代理 — 必须通过位置字段中提供的代理来访问请求的资源。

306 未使用 — 不再使用;保留此代码以便将来使用。

4xx 客户机中出现的错误

400 错误请求 — 请求中有语法问题,或不能满足请求。

401 未授权 — 未授权客户机访问数据。

402 需要付款 — 表示计费系统已有效。

403 禁止 — 即使有授权也不需要访问。

404 找不到 — 服务器找不到给定的资源;文档不存在。

407 代理认证请求 — 客户机首先必须使用代理认证自身。

410 请求的网页不存在(永久);

415 介质类型不受支持 — 服务器拒绝服务请求,因为不支持请求实体的格式。

5xx 服务器中出现的错误

500 内部错误 — 因为意外情况,服务器不能完成请求。

501 未执行 — 服务器不支持请求的工具。

502 错误网关 — 服务器接收到来自上游服务器的无效响应。

503 无法获得服务 — 由于临时过载或维护,服务器无法处理请求。

本文链接:http://www.icoa.cn/a/405.html
关键词: 百度蜘蛛   Google蜘蛛   谷歌蜘蛛   必应蜘蛛   雅虎蜘蛛   Yahoo蜘蛛  
上一篇:百度收录为零,www.cocold.com百度收录消失实录
下一篇:iis日志分析工具下载
相关文章
·今天搜狗蜘蛛疯狂的爬行了我的网站 2010-12-03 14:27:35
·百度蜘蛛饲养技巧(转帖) 2009-08-03 09:17:30
·增加外链的方式和重要性 2010-12-02 13:23:25
·营销型网络推广(SEO)需要注意的关键点 2010-11-26 09:25:56
·如何分析网站被降权的原因 2010-11-23 16:26:59
·404页面的设置导致网站被k? 2010-11-23 15:06:36
·百度收录为零,www.cocold.com百度收录消失实录 2010-11-18 10:21:27
·如何查看IIS日志及常见蜘蛛名称和标志 2010-11-13 09:39:40
文章评论

共有0条评论(点击查看)



7830

逍遥峡谷 逍遥乱弹 张立博 飓风团队 爱之路 酷品优选 宝贝派 张子涵


版权所有©逍遥峡谷 Copyright©Canyon of Airily 冀ICP备06033848号