《开放古籍平台》首页界面
(软件来源:体恒法师、隆藏法师)
该文作者叶健欣,?那搜寻工坊软体工程师。数位,就是大陆说的数字,搜寻就是搜索,工坊就是工作室,软体就是我们说的软件了。短短一个标题和作者身份介绍,足可窥沟沟两边的差异。
我最初接触电子书应该是在06年(其实windows的帮助又何尝不是电子书呢,但还是区别开来比较好)。那时正为即将毕业,而毕业后离开了图书馆就看不到书而犯愁,不意想却很意外的发现了电子书这个东西。我收藏得最早的电子书应该是北极星书库的chm格式的书,制作简洁也比较美观,现在也还很喜欢,可惜从那不久它就不做书了。后来又在52ebook上找到很多以exe为主的书,不过这个网站过不久也不开了。这是我收藏电子书的第一个时期,以单文件单书为主。
后来接触了钱氏藏书(制作人:钱建文),他的书制作精良,全是exe格式,是当时流行电子书中的上品。后来得到了他的25史,深为其强大的检索功能而折服,3、4千万字的25史全文检索不到一分钟就能完成。在那段特殊的岁月里,这个东西帮了我很大的忙。从此之后我就开始重视书籍合集的收藏,一个文件就可以囊括一个类别的书,检索也方便,不用再一本书一本书去搜。而当时网络上也广泛流通着各种各样的“合集”。这是我收藏的第二个时期,以单文件小型丛书为主。
而我藏书的第三个时期是从07年下半年我发现迪志《四库全书》开始的,这是一个商业化出版的大型文献数据库,出版时间居然是99年!在随后不久的时间里,我又接二连三的得到了《四部丛刊》、《图书集成》、《国学备要》这几部大型数据库。那段时间里我心情极度的兴奋,后来写下了曾被多次转载的《几部重要的电子书介绍及下载(历史方向)》一文,主要就是介绍这些在我还不懂电脑为何物时就已经问世的老古董。有了四库之后,我电脑上所有的古籍也就没有存在的必要了,所以在这个时期里我的收藏是以大型文献数据库为主。现在也还处在这个时期。
国学备要和四库的内容其实是重复的,两者之所以能在我电脑上共存是因为:一者备要内容太少,不能完全满足我的需要;二者四库和四部的使用十分不方便,搜索功能也不好。而备要的检索功能很强大,整个史部的检索(其实也就25史加点别的)一两秒就完成,而且它的反馈系统是我至今为止用过的数据库中最友好的。因此二者谁也替代不了谁。但四库这个鸡肋(不含任何蔑视的意思)使我始终想找到它的替代品,已知的就有《国学宝典》,不过这个东西在网上迟迟不见盗版。直到前不久得到了《汉籍全文检索系统简体本(第四版)》,我才算是有了一个自己比较满意的文献库。不过每个东西都是有弱点的,它的检索反馈方式就没有备要这么友好(至少我是这样认为的,不过也还算是不错了),作为一个数据库居然不带字典功能,而且简体本居然没有收十三经注疏,这是个不小的遗憾。在此后的不久,也就是我写这篇东西的前几天,我又得到了几年来梦寐以求的国学宝典,但使用之后我才发现这居然是个DOS版的东西,我用的时候它老会无故跳出,不知别人是否也这样。DOS版的东西使用起来当然是不怎么方便的,关键是它的史部很弱――不管是比之汉籍还是比之四库,所以下载的当天我就把它删了(不是常说,发布某某软件仅供研究之用,请在下载后24小时内删除吗,这次我做到了)。
之后就是前一阵子,我认识了《开放古籍平台》这个东西。其实之前它曾几次在我眼前掠过,但总是因为它的数据太少而没有引起我的重视。就像以前汉籍全文检索也曾无数次在我眼前掠过,但它的名字总让我认为它只是一个检索工具而不是数据而错过。这个东西的特点在于它的数据库的开放性,每一个人都可以为它增加内容,那么它的数据也就会随着爱好者的增多而无限扩展。了解了这个平台后,我的心情又变得激动起来,就像刚得到四库时一样(于是也和当时一样打算写下一点东西来纪念?不是,写这篇东西的动机和上次就不一样,这是我看完平台制作人写的标题说的那篇文章之后有感而发想写点东西的,以上只是顺便说说,随便聊聊而已)。激动之余我想起了另一个我曾经试用过的同样是开放式的平台MDict。它的主要对象是手机用户,目录不可分级,检索的反馈方式也很糟糕,因此它不是制作大型丛书的理想平台,但是拿来做词典还是可以的。不过我接触它时它的资源还比较少,所以之后就没有对它保持足够的关注。这次再去MDict资源论坛已发现不少好东西了,这就是开放的强大的体现吧。但它始终不是个适合做大丛书的平台,而古籍平台则是专门为大丛书设计的。对它的兴趣使我在网上搜集它的资料,于是很偶然的读到了制作人(可以叫他做叶工)的这篇文章,读来未免感慨,遂有此文。
“回想笔者和电子佛典的初次结缘,约莫在1992年,用286 1MB RAM的电脑,加上倚天中文系统和PE2纯文字编辑软体,开始输入一些常用的佛经。”92年,我在干什么?读小学。几年级?二年级。这时在台湾已经有很多人开始“典籍数字化”的处理工作了,而我在十多年后才开始接触一些粗制滥造的chm(那时四库已问世7年了,相对来说那些chm、exe都是粗制滥造),还满以为自己走在了时代最前列那群人当中的最前沿――因为当时在我身边还没发现有谁了解电子书这东西。
以前在寻找电子书的时候就经常能看到很多大部头的制作精良的佛教典籍,也很早就听说佛典数字化经众多信徒之手,速度极快。而古籍平台最初的内容又以佛典为主,我以为制作者必是佛教人士,没想到却不是,最多也只能算做一般信徒。在今天的典籍数字化工程中佛学界走在了各学界的前面,原来并不仅如此。“佛教界会领先其他的领域(有强烈商业动机者除外),有其历史原因。首先,宗教界向来就勇于尝试新科技。世界上第一部印刷品是汉文《金刚经》,西方第一部活版印刷品是古腾堡(Gutenberg)的《圣经》。再者,佛教界很清楚,太平盛世、皇帝英明,编大藏经来彰显国威是可遇不可求的。因此,由民间发起的倡印佛经的工作,自然成为一个传统,并且被视为积聚福德的方式。同样地,个人电脑开始普及,等不及政府或研究机构订计画、拨经费,三宝弟子们很自然、不约而同地前仆后继,投入数位佛典的工作。”在前不久我写的那篇文明4的文章里也提到过宗教,在文明4里信教可以加生产或者加科研,在这里大概也可以略窥宗教的力量了。
从这篇文章看来,作者从92年到至少07年(我才刚入道,他就已经超然了~)的15年时间里,一直在从事着典籍数字化这项工作(前期可能是业余的,后期是专业的)。15年里,他的生活质量应该不高(但也不会像我现在这样糟),这点从文章里可以体会得到。而积15年之功,最后产生的却只是一个“以GPL授权公众使用”的东西(有兴趣的可以百度一下什么是GPL)。我不知道作者内心做何感想,又为何能如此豁达,也许他认为这是一种“积聚福德的方式”。太多太多的人告诉我们:有钱不一定快乐。但又有太多太多的人把钱当作衡量一个人价值的唯一尺度,因而我们都不得不为钱而忙碌奔走。能够走自己的路不管别人说什么的毕竟是少数,而且这种人大概也很难跟别人和谐的相处,因此我们总是细心的观察环境而后很谨慎的处世。信仰是否是一种可以寻求超脱的方式?但我们从小就被教育说:宗教是人民的鸦片。而现在又不信马教了,所以我们就成了没有信仰的一代。
不管是有信仰还是没有信仰,始终也无法改变我是个穷人的事实,但人民有了鸦片之后,偶尔总还是可以快活一下的。其实我也没为赚钱花过多少心思,如果我也能有钱的话,大概这个天道也就不怎么公了。每个人都在为自己的事而忙碌,有的人为了钱而有的人为了某种抽象的东西,在自己的道路上有收获了,在其他地方所得到的自然也就少一些。
话题再回到accelon,展望未来,至少在一个不短的时期里,电子书的主要形式是数据开放平台。但是这个平台不可能是MDict,因为它的目录功能很弱,检索功能也很弱,拿来做手机词典还可以,做PC上的词典只能说勉强――要是遇到输入不了的字,真的不知道该怎么办。同时也不可能是accelon,accelon的理念是不追求美观,这是对的,书籍因以内容为主,美观只是徒耗我们的计算机资源而已。但是它也太不美观了,界面凌乱以至于很影响阅读心情。当然,应该说这种凌乱在很大程度上是数据造成的――还是很怀念国学备要的那个界面。其实现在随便一个公司都可以开发出比这更好的产品,关键是现在还没有,但相信以后会有的。因为大陆的网络上很流行免费经济学,虽然没有钱可图,但一点也不影响它作为一个“大市场”而存在。