寻梦网络,wangdi1900的个人空间,真诚期待与你成为朋友!

又是巴比伦……

上一篇 / 下一篇  2006-12-02 10:59:29 / 个人分类:软件

又是巴比伦……

很久没更新MSN Space了,不过就这样吧,反正还有很多事情忙着。

     最近想自己弄一个巴比的词典,于是傻乎乎的上网上狗上百去搜,乱刷了半天(挺喜欢用这个字,毕竟在一页搜索结果里面没有你要的东西,你就点“下一页”,然后页面就“刷”……),最后才突然间明白“解铃还须系铃人”,babylon builder就在babylon.com上……

     只是好几天过去了,还是只知道生成文本格式的字典,不会导入html格式,而且连自己该自己做还是继续上网“狗”一番都不清楚……

     不过还是有所得的,就是了解了巴比的词库压缩格式的厉害。一个文本格式9.7M的文本词典,通过前面的buider之后,生成出来的bgl文件体积仅有4.49M;导入巴比生成的bdc文件大小是13.1M,把这个bdc文件用winrar压缩(最大压缩率、固实)成5.67M,所以由此结果看来,巴比的bgl格式其实最适合用来备份巴比词典的,尤其是那个SOED词典,bgl文件才13M多,解成bdc出来了个98.8M!除非是维基词典,看过我的苦难经历之后,你就知道即使你有bgl的维基,你也最好在出来一个bdc之后备份bdc,不然你重装完所有软件之后你的硬盘还要经历一次疯狂的转呀……
    

     提到维基,也顺便说一下bdc文件的秘密。说秘密只是因为我以前不知道,也不代表这就表示我知道。我班的一个同学在我说了一遍又一遍“要谨慎下载维基词典”之后依然义不容辞地从我那下了这个1G的庞然大物,然后在自己的机器上安装(当然是在我的监护之下),然后发现每个她下的bdc文件只要都放在gloss文件夹下(不知道这是哪个的参看我前作“苦难经历”),双击一下瞬间完成安装(热烈表扬这同学的献身精神和热烈感谢这同学的拔“机”相助),同时bdc文件也没有体积的变化,使用也没有任何问题。本想抱头痛哭“为什么就是我要受此磨难啊~”,可是回头一想,这也是好事,至少以后重装就省事多了。今天多思考了一下,既然我拿到的维基是bdc格式的,为什么我还要重新生成索引,而我的bdc拿到别人的电脑上就不需要?思考的结果是,重新生成索引是因为版本不一样造成的。可能我下的维基是在不同的巴比上生成过的,而不同版本的巴比处理索引的方式不一样,于是在引入旧的bdc文件时就要重新分拆文件,分离索引,然后再重新生成索引,合成,于是就出来我苦难经历里面那一幕,好几个G量级临时文件的光临。所以只要保证安装的巴比版本一样,bdc文件是可以共用的。

     另外还多事做了个winrar压缩率比较试验,就最开头提到的词典,bdc格式,原来体重13.1M,winrar最高+固实也就5.67M,但在winrar的加入文件对话框的高级标签里面按压缩按钮(也就是进入winrar高级压缩设置),选择文本压缩里面的“强制”然后设顺序预测为63,使用内存为128M(两个都是最高可设值),结果压出来的文件大小才4.64M,比bgl才多一点而已。毕竟bdc文件里面多了索引数据,压出来比bgl大是可以接受的。
     再压了一下转制成bgl之前的源文本文件,用同上设置的强制文本压缩,结果出来的大小仅2.99M!而7z使用8M字典LZMA方式压缩(占用内存为123M)压出来的有3.16M!
看来winrar即使平均压缩率不够7z高,但由于有强制文本压缩功能,winrar在文本压缩方面具有比7z强得多的爆发力。而且,只要你确认你要压缩的文件都是文本文件,打开强制文本压缩之后压缩的速度反而比普通压缩快,而且文件越大越明显,文件大小还有显著的区别!!7z尽管标称压缩率比winrar高,不过winrar还有自己的优势啊!

总结:winrar在文本压缩方面还是有过人的实力的,只是需要手动打开;
     要备份巴比的词典,最好是其原格式bgl,当然如果你有词典的源文件,那还是用源文件压缩好,就是恢复的时候要折腾一段时间;如果你是重装狂人,或者要备份像维基那样的巨无霸(还有第二个巨无霸?知者请告诉我),最好还是bdc格式,只要你的巴比版本保持一致就可以了;当然,最好的方法还是把巴比安到别的分区,反正恢复系统之后(除非你作系统分区备份的时候已经安装过巴比)还是要双击每一个词典文件安装,原地的bdc是最快而且不需文件移动或解压的方法。

来自:http://hzhbest.spaces.live.com/blog/cns!384A69E99623219B!139.entry

 

经过本人实践成功,绝对有效的成功安装.

相关babylon下载请看:

http://www.xmsq.com/space/7740/viewspace_6108.html


TAG: 软件 互联网 Babylon 巴比伦

 

评分:0

我来说两句

显示全部

:loveliness: :handshake :victory: :funk: :time: :kiss: :call: :hug: :lol :'( :Q :L ;P :$ :P :o :@ :D :( :)

日历

« 2009-01-10  
    123
45678910
11121314151617
18192021222324
25262728293031

数据统计

  • 访问量: 243234
  • 日志数: 1577
  • 图片数: 5
  • 文件数: 27
  • 书签数: 176
  • 建立时间: 2006-08-06
  • 更新时间: 2008-12-26

RSS订阅

Open Toolbar