MediaWiki百度收录的问题

来自Jamesqi
跳转至: 导航搜索

--James Qi 2008年9月27日 (日) 16:48 (CST)

  用MediaWiki做网站有几年时间了,一直都关注着搜索引擎对这些网站的收录。可以看出Google对MediaWiki平台做的网站收录很正常,而百度就不理想,特别是在收录的初始阶段。

  我们的Wiki网站以前曾经有收录错了内容、收录错到其它网站的情况,而且很长时间没有纠正过来。

  另外百度对UTF-8编码的支持不好,搜索页面中网址都是乱码,而Google、Yahoo都可以看到正常的汉字。

  百度对MediaWiki收录的页面让人莫名其妙,例如收录了好多“链出更新”的无用页面,还有内容很少的“QC”、“QC talk”等页面,这个问题很长时间了,今天干脆编辑了robots.txt文件,把这些网址屏蔽起来,顺便把用户页面、用户对话页也屏蔽起来:

User-agent: *
Disallow: /Special:Recentchangeslinked/*
Disallow: /User:*
Disallow: /User_talk:*
Disallow: /QC:*
Disallow: /QC_talk:*

  还在LocalSettings.php中也设置了屏蔽这几个Namespace:

$wgNamespaceRobotPolicies = array(
 NS_USER => 'noindex' ,
 NS_USER_TALK => 'noindex' ,
 NS_QC => 'noindex' ,
 NS_QC_TALK => 'noindex' ,
 NS_DATA => 'noindex' ,
 NS_DATA_TALK => 'noindex' ,
 NS_TASK => 'noindex' ,
 NS_TASK_TALK => 'noindex' ,
 NS_TALK => 'nofollow' );

  还有更重要的,目前百度对 人工搜索 这个网站的收录更新极慢,一周之内的新收录页面没有,而谷歌是每天都新收录好多,这可能是我们网站在不同的搜索引擎中权重不同,似乎没有捷径好走,只有等百度自己逐步去“觉悟”吧,这个域名被百度重新收录也是7月份左右的事情,希望还过两个月应该会更新快起来。

标签:MediaWikiWiki百度Google收录SEORobots.txt
相关内容:
  1. 2010-11-10 22:20:28 MediaWiki-1.15升级到1.16.0步骤
  2. 2010-11-04 22:52:58 开启MediaWiki的搜索建议(Search Suggest)功能
  3. 2010-11-03 11:26:02 MediaWiki-1.15.0升级到1.16.0中出现的问题
  4. 2010-11-02 23:52:05 MediaWiki-1.15准备升级到1.16
  5. 2010-10-22 22:29:00 想写一本关于MediaWiki的书,有人需要吗?
  6. 2010-09-20 11:33:29 直接操作MediaWiki的MySQL数据库
  7. 2010-09-17 23:05:36 注册Google Affiliate Network试试
  8. 2010-09-12 21:54:42 和出版社一起参加2010年AdSense北京站
  9. 2010-09-04 00:20:09 修改模板对付MediaWiki及扩展程序的Bug
  10. 2010-08-31 00:47:49 分割大容量MediaWiki数据库
  11. 2010-08-16 23:06:20 百度发布SEO指南1.0版
  12. 2010-07-08 23:08:13 用HTML和站间链接减小MediaWiki数据库记录
  13. 2010-07-08 22:42:29 让搜索引擎新收录1000万个页面
  14. 2010-06-24 22:15:05 《Google AdSense实战宝典》按时面世
  15. 2010-06-12 12:27:01 将数据导入MediaWiki进行到底

别名:百度对MediaWiki系统做的网站收录效果不佳百度的搜索技术对用MediaWiki软件的网站收录支持不好

关于“MediaWiki百度收录的问题”的留言:

目前暂无留言

新增相关留言