完成了人工搜索网站批量修改、导入的任务

出自James Qi

跳转到: 导航, 搜索

所在位置:首页 > 日志 > 完成了人工搜索网站批量修改、导入的任务

--James Qi 2008年8月3日 (日) 00:33 (CST)

  在前年、去年做Wiki网站中,曾经大量采用了XML数据批量导入的办法,生成了很多页面,这个办法本身是MediaWiki提供的一个有力工具,但用得效果好不好主要是看内容质量了,质量不高的内容导入再多也没有用。

  去年下半年开始做人工搜索网站后,就基本上没有用到批量导入的工作了,都是踏踏实实一个一个页面地进行编辑。

  最近对网站框架进行了比较大的调整,需要将以前的页面都修改为摘要单独为一个Note页面的做法,另外还是页面顶部、页面中部、页面底部模板都加上标题参数等调整,好几千个页面逐个修改是不能想象的,就用起来以前掌握的批量Export,然后在UltraEdit中进行替换、宏操作,再Import到数据库中的办法。嗯,幸亏有这样的办法,才能在几天内全部完成转换!

  然后趁热打铁,将以前的重定向页面也全部批量修改为使用“同义”模板的页面,这样在搜索引擎中的收录效果会好很多,当然服务器的负载会有所增加,从我们6月份后开始使用“同义”页面的效果来看,总体还是值得的。一共有大几千个页面用了2、3天也全部修改、导入完成,以后就需要人工看到还需要添加什么再临时添加同义页面。

  不过这几天还遇到一些麻烦,电脑再次被N多木马病毒侵入,最后只要重新修复安装,花了我好多时间!

  7月底给兼职编辑者发布了特别的奥运会中国运动员页面编辑任务,只做包含“摘要”、“精选”的简要页面,不需要做包含“各类相关信息”的完整页面。然后我们几个管理员也准备全力以赴在奥运会期间抢抓热点,让网站的访问量和知名度有一个大的提升!

标签:人工搜索, XML
相关内容:
  1. 2008年12月16日 (二) 18:00: Mahalo.com到底要干啥? ‎(85次浏览)
  2. 2008年11月18日 (二) 12:27: “刘烈宏”为什么不能谈论? ‎(274次浏览)
  3. 2008年10月16日 (四) 23:28: 人工搜索:林松岭的家庭背景 ‎(1,487次浏览)
  4. 2008年9月26日 (五) 11:52: 祝咏兰照片是谁伪造的? ‎(629次浏览)
  5. 2008年9月21日 (日) 21:32: 奥运会后:毒奶粉、溃坝、矿难,还有毒校服、大火灾 ‎(229次浏览)
  6. 2008年9月21日 (日) 17:03: 党的书记:一夫二妻书记、三玩书记、五毒书记...... ‎(329次浏览)
  7. 2008年9月17日 (三) 21:57: 打酱油、俯卧撑后的强词:买牙膏 ‎(275次浏览)
  8. 2008年8月12日 (二) 00:50: 我的奥运时间和角色转变 ‎(338次浏览)
  9. 2008年7月31日 (四) 13:04: 限制级别的中文新闻网站列表 ‎(738次浏览)
  10. 2008年7月24日 (四) 00:14: 为人工搜索网站再次完善结构,添加Namespace ‎(445次浏览)
  11. 2008年7月22日 (二) 12:26: 昆明爆炸“蝼蚁总动员”,为什么称“蝼蚁”? ‎(1,333次浏览)
  12. 2008年7月19日 (六) 14:35: “吉娜·丽萨在线观看”把我们的服务器也要搞垮 ‎(1,927次浏览)
  13. 2008年7月17日 (四) 00:11: Google这次真玩"人肉搜索" ‎(546次浏览)
  14. 2008年7月14日 (一) 23:18: 怎么了?北京天安门、浙江玉环、潜江警车 ‎(492次浏览)


用户留言:
目前暂无留言
新增留言

个人工具