用MediaWiki搭建多语言网站群框架
--James Qi 2010年4月2日 (五) 00:38 (CST)
MediaWiki最著名的应用就是维基百科,这完全是多语言网站群,有数百种语言版本、上十个姊妹计划,维基媒体基金会总的网站数量可能有上千吧。
2006年我们用MediaWiki平台不久就曾经用过多语言版本,做了Wiki版本的实用查询三种语言版本:简体、繁体和英文。感觉用起来还是很方便的,搭建多语言网站比较成熟,互相之间的链接很容易。此后我们还利用中文简体、繁体的自动转换做了其它Wiki网站的自动克隆简繁转换网站,例如人工搜索:简体、繁体。
而去年底、今年初国内开始的严管网站让我们也不得不考虑做其它语言的内容网站,避免单一中文网站的运营风险,可以先从我们熟悉的实用查询类似网站做起,就把存在时间超过10年的查号吧和邮编库来作为多语言的试验田。
除了已有的中文简体和繁体以外,本来先只准备加英文版本,后来考虑干脆搭建更多语言的框架起来,留着以后逐步补充完善。在网上搜索了使用最广泛的10种外文,分别是英文、德文、法文、西班牙文、葡萄牙文、意大利文、俄文、日文、韩文和阿拉伯文,虽然本人只学过英文,但这次也大胆把10种外文框架全部搭建起来。
上个月花了一些时间新设立MediaWiki网站,并补充了部分内容,初步搭建起来下列网站:
其中英文算是比较熟练的,其它西欧语言德文、西班牙文、法文、意大利文、葡萄牙文也有一些类似,俄文就怪一些,每个字母都五大三粗的,日文中的汉字可以看出一点意思(大学选修了一阵子早忘光了),韩文实在看不懂,最奇特还是阿拉伯文,从右到左的顺序让文本编辑很不习惯。这次在搭建的过程中多学了9门外语,呵呵。
最近正好从谷歌中文博客中看到一篇文章:管理多语言网站,写得很有指导意义,其中说到的URL结构、横行链接、编码字符等也都与我们现在的结构相同,其中特别还说到不要用自动翻译内容的问题,一定要做让人看得懂、有用的多语言网站,而不是自动翻译的垃圾。这一点上我们也有考虑,搭建框架的时候可以用很少的自动翻译单词、词组,添加内容的时候因为区号、邮编等信息,并不是大段的句子、段落,所以也完全可以利用自动翻译,将地名准确翻译出来,再加上区号、邮编是阿拉伯数字,所以最后的页面应该是容易明白的,不会成了看不懂的病句。
花了几个星期的断断续续时间搭建框架,后续还要做的一系列工作:
- 将查号吧各个语言版本国家/地区的地名做整齐规划,并可以使用同义词模板来指定别名;
- 调用Google地图、AJAX Search API以及AdSense for Search等都指定对应的语言;
- 将邮编库各个语言版本国家/地区的地名页面标题与查号吧对应,然后先全部生成页面;
- 每个网站做单独的sitemap,通过robots.txt和Google Webmastertools等提交到搜索引擎;
- 以中国的城市为标题,做成独立页面,便于外文搜索到,再推广到中国以外的城市;
- 找对各种语言熟悉的朋友,帮忙检查、修改语句。
这些工作不是几天、几个月可以做好的,会用几年逐步来做吧,反正查号吧、邮编库也有10多年了,这些其它语言也可以慢慢积累,到一定时候才能有所成绩。
标签:MediaWiki、语言、网站、查号吧、邮编库。 |
相关内容:
|