- 正文
- 点这评论:( 17人参与)
-
刚心血来潮,在谷歌搜索框里输入site:www.imwen.com,然后翻到最后面看,却不想此刻我惊呆了,因为整页的搜索结果都是You are not login, Exiting...,这是搜索引擎没有登录网站后台(废话,搜索引擎都登录了网站后台,那还了得)被拒绝服务的信息。
我往前翻,郁闷了,好几页了,还是这个结果,一直翻了五页,才发现收录的正常网页。不过我立马就明白是我博客的robots.txt文件没有设置正确,让搜索引擎试图爬行了需要登录后台才能浏览的页面,这当然会导致访问出错,就如普通访客没有登录进不了后台一样。
这样的收录结果,对于网站来说,是不利的,别看现在谷歌收录了,对于我这个新站来说,还在沙盒里呢,记得卢同志有说过这个。我得重新调整一下robots.txt文件,才能让搜索引擎满意,一定程度上来说,间接对用户友好性会好点,因为搜索引擎索引越精确,搜索结果提供的内容质量也会比较好吧。总之尽量避免下面图中所示的这个情况出现了。
至于robots.txt文件,百度一下,百度百科的答案就可以了。主要就是要建立一个robots.txt文件,叫做搜索引擎蜘蛛爬行许可文件吧。放在网站根目录下,robts.txt文件里基本语法是(括号内为注释内容):
User-agent : * (本句代码表示对哪些搜索引擎起作用,理论上*表示任何搜索引擎)
Disallow : / ADMIN / (Disallow表示不允许访问索引,例如本句的ADMIN文件夹)
Disallow : / DATA / (不爬行索引数据库文件夹及其里面的任何文件)
Disallow : / CSS / (不爬行索引样式文件夹及其里面的任何文件)
Disallow : / FUJIAN / IMAGE / (不爬行附件下的图片文件夹及其里面的任何文件)总之,按照搜索引擎的游戏规则,作为网站一定要置放robots.txt文件,如果不清楚该怎么弄robots.txt里面的句法语法,那就什么都不填,就一个空的robots.txt,对搜索引擎而言,也是起作用的。
上面介绍的内容,我也是略有了解,有什么不对的地方,还请来此关照我的高人们尽情指点!
已有 17 位网友发表了一针见血的评论,你还等什么?-
-
17楼
雷小虎
回复该留言
Post:2011-7-14 14:14:07robots搞错,后果真严重啊
-
17楼
雷小虎
回复该留言
-
-
16楼
标语大全
回复该留言
Post:2011-6-30 16:04:55嗯,这个文件要特别注意。不会写就干脆啥都不写还好。
-
16楼
标语大全
回复该留言
-
-
15楼
海外网站推广
回复该留言
Post:2011-6-27 18:14:38学习了....
-
15楼
海外网站推广
回复该留言
-
-
14楼
先看看
回复该留言
Post:2011-6-27 15:27:52这个我的好像还没有弄好啊
-
楼
乾元轩
回复该留言
Post:2011-6-27 16:53:11那就要弄一弄咯,呵呵
-
14楼
先看看
回复该留言
-
-
13楼
长沙新娘跟妆
回复该留言
Post:2011-6-27 14:55:37路过,自然要顶一下!
-
13楼
长沙新娘跟妆
回复该留言
-
-
12楼
鲜果
回复该留言
Post:2011-6-27 10:52:16我感觉我的现在就写错了....
-
12楼
鲜果
回复该留言
-
-
11楼
心情阳光
回复该留言
Post:2011-6-27 10:30:25一直没去弄过这个文件,wordpress默认配置没有吗?额,我得弄弄了!
-
楼
vfeng
回复该留言
Post:2011-6-27 10:32:28这个,要自己新建的
-
11楼
心情阳光
回复该留言
-
-
10楼
oralce学习
回复该留言
Post:2011-6-27 10:29:04这个文件和404都得设置好哦!
-
楼
vfeng
回复该留言
Post:2011-6-27 10:32:03是啊,少不了
-
10楼
oralce学习
回复该留言
-
-
9楼
加盟
回复该留言
Post:2011-6-27 10:26:35做这一行就是要坚持,就是老板不理解,做的挺郁闷!
-
9楼
加盟
回复该留言
-
-
8楼
肖俊
回复该留言
Post:2011-6-27 9:18:21不管是否考虑SEO因素,该禁止显示在搜索引擎里的还是要禁止。
-
楼
vfeng
回复该留言
Post:2011-6-27 9:32:34对的,出于安全性、速度性等种种因素,是不是[F]Shame[/F]
-
8楼
肖俊
回复该留言
-
-
7楼
混小子
回复该留言
Post:2011-6-27 9:15:00你怕人家社工你 哈哈
-
楼
vfeng
回复该留言
Post:2011-6-27 9:31:57被你看穿了[F]Hehe[/F]
-
7楼
混小子
回复该留言
-
-
6楼
加盟
回复该留言
Post:2011-6-27 9:09:18俺们公司的网站也应该还在沙盒里呀!鸭梨很大!
-
楼
vfeng
回复该留言
Post:2011-6-27 9:31:38此种情况要坚持做好自己,呵呵。百度已经收录,虽然少,但至少有收录,呵呵
-
6楼
加盟
回复该留言
-
-
5楼
网站优化
回复该留言
Post:2011-6-26 15:29:49这个是一定要处理好的!
-
楼
vfeng
回复该留言
Post:2011-6-27 8:40:12对啊,不然就可能会吃亏
-
5楼
网站优化
回复该留言
-
-
4楼
太子虹
回复该留言
Post:2011-6-26 15:00:47真不错,呵呵
-
4楼
太子虹
回复该留言
-
-
3楼
山野愚人
回复该留言
Post:2011-6-26 14:21:07这个早就注意了哈
-
楼
vfeng
回复该留言
Post:2011-6-27 8:39:47有经验的人就会注意[F]Haha[/F]
-
3楼
山野愚人
回复该留言
-
-
2楼
创业博客
回复该留言
Post:2011-6-26 13:44:13这个很关键,啥时连你机密都被GG收录了!!
-
楼
vfeng
回复该留言
Post:2011-6-27 8:39:26[F]Cry[/F]某些文件夹忘记了放入disallow
-
2楼
创业博客
回复该留言
-
-
1楼
昭通SEO
回复该留言
Post:2011-6-26 12:50:19还是要做robots.txt文件的,这样可以让机器人访问你的网站需要抓取的地方,提高速度
-
楼
vfeng
回复该留言
Post:2011-6-27 8:38:35是啊,这个文件必须的
-
1楼
昭通SEO
回复该留言
【相关文章】
- 2018-10-21 11:17:34如何查询浏览器的User Agent
- 2018-1-26 7:19:23【技术】fiddle抓取cmd命令行下jar包提交的的http和https数据
- 2018-1-25 22:55:6【技术】html5网页添加音乐按钮并自动循环播放方法
- 2017-8-24 22:21:11电脑端与移动端网页转换自适应设置
- 2017-6-23 1:0:2电脑开机不用登录账号自动运行bat文件
- 2017-6-21 23:22:42zblog编辑文章发布没跳转zb_system/cmd.asp?act=ArticlePst解决
- 2017-4-7 9:50:4阿里云服务器FTP设置外网访问200,227问题解决方案
- 2016-10-28 1:10:24windows iis用CMD命令行开启Php workerman.php服务问题解决