MediaWiki中重新生成搜索文本索引rebuildtextindex.php

出自James Qi

跳转到: 导航, 搜索

所在位置:首页 > 日志 > MediaWiki中重新生成搜索文本索引rebuildtextindex.php

--James Qi(讨论) 2007年12月24日 (一) 13:37 (CST)

  去年折腾了好长时间,终于可以将人工或者程序生成XML文件成功用importDump.php导入MediaWiki数据库中,然后就采集、处理了很多数据,分别导入到文库、实用查询Wiki等网站中,但当时遗留了一个问题一直没有解决,那就是虽然数据导入了,可以通过链接或者从搜索框“进入”查看,但从搜索框“搜索”功能却一直查找不到导入的内容,只有人工逐页重新编辑保存的内容可以搜索到,对于上万条的数据进行人工保持一遍显然是不现实的。当时在maintenance目录中找到了rebuildtextindex.php这个程序可以实现重新生成搜索文本索引的功能,但因为调试使用中出现问题而没能使用。

  以后从Google Analytics后台来看,几个Wiki网站访问量最多的页面中都有“搜索”这个页面,而该功能却是有问题的(除了导入的数据搜索不到以外,还有对中文UTF-8支持不好的问题),因为事情太多没有当时解决,这一拖就是一年了,后来这段时间也少有导入大批量数据,前些天在027百科中导入了大批中小学等数据后,这个问题再次出现,于是硬着头皮再试。

  主要的问题出在数据库报错上,很小的维客网站上试运行rebuildtextindex.php是没有问题的,但数据量多的情况下就出现:“2006: MySQL server has gone away”,上午在检查MySQL的时候还误操作把root@localhost删除了,当时吓了一跳,Image:Face-033.gif心想这可麻烦了!好在后来在同事和Hack988的帮助下基本恢复了,然后将my.cnf中的timeout从60改到120、240后,重启MySQL,终于可以在一些网站上成功运行了!Image:Face-001.gif

  我们导入过XML文件数据的Wiki网站有:027百科实用查询Wiki實用查詢WikiReference Wiki邮政编码查询电话区号查询奥运维客足球博物馆个人维客空间维客笔记本维客实验室等网站,会随后一一来生成该索引。

标签:MediaWiki, MySQL
相关内容:
  1. 2008年12月5日 (五) 23:00: MediaWiki的StringFunctions扩展 ‎(77次浏览)
  2. 2008年11月6日 (四) 22:47: 启用Squid和MediaWiki的File Cache双重缓存 ‎(160次浏览)
  3. 2008年10月21日 (二) 15:40: 启用MediaWiki的File Cache功能,生成静态HTML页面 ‎(308次浏览)
  4. 2008年10月18日 (六) 10:39: 关闭一些以前的Wiki网站 ‎(329次浏览)
  5. 2008年10月7日 (二) 22:31: MediaWiki系统的Robots.txt ‎(177次浏览)
  6. 2008年9月28日 (日) 22:48: 用Google Ajax Search API弥补MediaWiki中文站内搜索缺陷 ‎(241次浏览)
  7. 2008年9月27日 (六) 16:48: MediaWiki百度收录的问题 ‎(287次浏览)
  8. 2008年9月26日 (五) 09:32: MediaWiki的页面自动编辑保存AutoEdit ‎(232次浏览)
  9. 2008年9月20日 (六) 22:03: 再次用301永久重定向转移网站域名 ‎(231次浏览)
  10. 2008年8月14日 (四) 02:37: MediaWiki克隆繁体网站 ‎(363次浏览)
  11. 2008年5月16日 (五) 17:29: 用301永久重定向来转变域名 ‎(1,505次浏览)
  12. 2008年4月9日 (三) 23:27: 超强的MediaWiki扩展功能:DPL动态页面列表 ‎(969次浏览)
  13. 2008年3月19日 (三) 14:21: 在MediaWiki平台下模拟数据库功能 ‎(1,088次浏览)
  14. 2008年3月8日 (六) 00:18: 重新设计一把刀人工搜索的质量检验过程 ‎(797次浏览)
  15. 2008年1月15日 (二) 16:12: 痛苦的服务器数据备份恢复过程 ‎(616次浏览)


用户留言:
目前暂无留言
新增留言

个人工具