周文业 | 五大名著主要版本数字化比对本丛书简介(下)
内容提要:本文介绍中国古代小说版本数字化研究的现状,中国古代小说版本数字化比对方法,主要介绍五大名著主要版本数字化比对本的编写情况,并对五大名著版本比对中一些问题分别作了详细说明。对五大名著版本版本研究发表了一些看法。最后介绍了历届中国古代小说版本数字化研讨会举办情况。
关键词:五大名著 版本 数字化
例5 《西游记》世德堂本、唐僧西游记、西游证道书、朱鼎臣本四版本分栏对照(第1回部分文字)
分栏对照
例6 《西游记》世德堂本、唐僧西游记、西游证道书、朱鼎臣本四版本逐行对照(第1回部分文字)
逐行对照
例7 《金瓶梅》词话本、崇祯本二版本分栏对照(第1回部分文字)
分栏对照
例8 《金瓶梅》词话本、崇祯本二版本逐行对照(第1回部分文字)
逐行对照
例9 《红楼梦》八版本分栏比对(第一回部分文字)
分栏对照
例10 《红楼梦》八版本逐行比对(第1回部分文字)
逐行对照
一般研究版本差异时,可先用分栏显示观察版本文字差异的整体情况,寻找问题。
通过分栏比对发现问题后,再针对个别问题,用逐行比对显示方式,再逐字比对,仔细研究。
计算机比对有两种结果:分栏显示和逐行显示。而版本录入又有繁体字和简体字两种,因此组合后有四种比对结果。
(1)繁体字分栏显示。
(2)繁体字逐行显示。
(3)简体字分栏显示。
(4)简体字逐行显示。
5.其他统计
此外,版本数字化后,还可用计算机对几个版本文字的相似度,以及版本的句长、同词脱文进行计算自动统计,供研究分析。
三、五大名著版本数字化比对本丛书
(一)五大名著主要版本纸本比对本
五大名著主要版本比对本是在每本书的几个主要系列中,各选一种主要版本进行比对。
l 《三国志演义》:嘉靖本、叶逢春本、黄正甫和毛本,四种。
l 《水浒传》:容与堂本、郁郁堂本、评林本和金本,四种。
l 《西游记》:世德堂本、唐僧西游记、朱鼎臣本和西游证道书,四种。
l 《金瓶梅》:词话本和崇祯本,二种。
l 《红楼梦》:甲戌本、庚辰本、戚序本、甲辰本、列藏本、郑藏本、梦稿本、程甲本、程乙本,九种。
(二)纸本比对本的价值
有人认为编写这种纸本比对本没有多大意义,现在对版本有兴趣的人不多,有多少人会去买?这也是事实。
据我所知,只有《红楼梦》版本研究还有不少爱好者,对其他四大名著版本有兴趣的人确实不多。
但造成这种情况的一个根本原因是,虽然各种版本的影印本和排印本出版很多,但缺乏真正可以使学者很方便地了解版本文字差异的相关资料。
要学者们都去逐个比对版本文字差异根本不现实,这是导致对版本有兴趣和研究的人越来越少的根本原因。
但如果出版了这种纸本比对本,对于普及版本肯定有帮助,学者从比对本可以清楚看出版本的文字差异,就会引起对版本研究的兴趣,从而推进版本研究。
但纸本比对本的市场究竟有多大,目前还难以估计,还要看推出后的效果如何。
我想,我把这十几年研究成果做个总结,也算是一个成果吧,也是了了自己的一个心愿吧。
《三国志通俗演义文史对照本》
(三)版本比对本的编写
下面介绍五大名著版本比对丛书编写方法。
1.分栏和逐行
为便于读者比较阅读和比较两版本文字差异情况,纸本同时推出分栏显示和逐行显示两种纸本。因为两种方式各有优缺点。
2.简化字和繁体字
古代小说版本数字化文本有简化字和繁体字两种,经考虑最后决定只出版简化字版。这是因为:
第一,纸本是面对一般学者和版本爱好者,因此简化字方便阅读。
第二,繁体字的文本录入中有大量异体字和俗体字,要逐字检查,工作量极大。而简化字相对工作量较小。
3.不标点、分段
简化字录入时都有标点和分段。但因为版本文字比对时,如果插入标点比对,各个版本文字标点不同,会导致比对混乱。因此比对结果不加标点,不分段。
这对于一般学者阅读没有什么问题。
4.文字错误和异体字、俗体字
原文本中有时有一些明显的文字错误,多是抄录时发生的错误。这些文字错误有的对版本研究还有参考价值。
考虑编辑纸本比对本不是供一般阅读的,而主要是供版本研究参考的,因此对这些抄录中发生的文字错误一般都不改正。
另外,由于古代小说是供一般大众阅读,因此抄写时不十分严谨,有很多异体字、俗体字。
在主要版本比对本中,全部改为正体字。但在其他版本比对本中,对于异体字和俗体字,将根据具体情况处理,有些改为正体字,有些就不改了。
5.文字差异大不比对
有些版本某些回目中的文字差异巨大。如《水浒传》中田王二传,全传本和简本故事差异太大,无法比对。因为没有比对,为便于读者阅读,文字就增加了
标点符号。但因为故事完全不同,因此文字也就没有分段。
6.故事颠倒
《水浒传》刘唐送书给宋江和宋江见阎婆两故事,在容与堂本、评林本和全传本、金批本完全颠倒了。
在比对本中,为使读者更清楚这两个故事颠倒的情况,比对分两次进行。
第一次不改变顺序比对第20回和第21回,这样比对结果会出现大批文字空白。第二次人为改变故事顺序,改变全传本、金批本故事顺序,和繁本一样,再比
对一次,这时文字差异就大大缩小了。
7.文字缺失
有些版本中文字有整回文字缺失。如《三国演义》叶逢春本十二卷中缺失两卷,为保持完整,缺失部分用其他版本(如余象斗本)补上,并加注。
8.分回不同
有些版本的分回不同,这又有两种情况。
l 有的是两回合并为一回。如《水浒传》简本的回目差异很大,有104回、115回等几种。因为回目不同,因此有些回目就合并了。如评林本104回中第7、8
两回合并为一回,类似情况还有很多。
l 有的是回目相同,但分回处不同。这在《三国演义》版本中有多处。在《西游记》中《西游证道书》因为补充了唐三藏出身,分回处和其他版本不同。
这样如照样比对,就会出现文字极大差异,对阅读很不利。
为此,对这类问题都做了调整。
l 两回合并为一回的,仍分为两回比对。
l 分回处不同的,选择某个版本为标准,其他版本都照此本分回处来修改。
这些修改都逐一加注说明。
以上这些修改并未改动版本的原文,而只是为比对更清楚,而只改动了比对方式而已。
9.版式、篇幅
纸本比对本如果开本小,每栏(每个版本)的文字太少,显示阅读不方便,因此决定采取8开本,10号字。版式为55×47字,每页约2585字。
五大名著主要版本两种形式比对本,总计23册,总字数约3,900万字。
五大名著主要版本比对本篇幅:
四、对古代小说版本研究的看法
五大名著版本问题一贯非常复杂,对此有如下体会。
第一,研究版本首先是要分析文字差异。
数字化比对可以快速、一字不漏地查出所有的文字差异,为后续分析打下很好的基础。
戚序本和庚辰本关系等研究利用了数字化比对,效果很好。在数字化比对基础上,还要根据分析的目的,对文字差异进行分类,以便于下一步研究。
第二,要对文字差异进行合理的解释。
解释中要特别注意解释的多种可能性,不带任何偏见。对以上所有问题,还都存在多种解释,即存在多种可能性。对多种可能性要进一步分析哪种可能性更
大。
要注意,从不同角度分析,各种可能性的大小会不同。这样问题最终又演变成哪种解释更合理,哪种可能性更大的问题。而这又是仁者见仁,智者见智的问
题了,最终恐怕无法得出大家都认可的结论。
这也是古代小说版本研究中的难题,很多问题最终都没有结论。
第三,要特别注意研究各种问题的严密推理。
在版本研究中,严密的推理非常重要,有些学者的推理根本不合逻辑,和这样的学者讨论问题就非常困难了。
第四,版本研究的复杂性。
虽然数字化比对可以做到无一遗漏,但由于资料不足,又有多种解释和可能性,很多问题最终可能还是无法得出令人信服的结论。
五大名著版本中的矛盾非常多,这些矛盾是如何产生的,又有多种解释。
由于资料不足,要确定到底是什么原因造成这种矛盾现象,是十分困难的,甚至可以说,要彻底破解这些谜团是完全不可能的事情。
第五,研究只要有进展就是进步。
对五大名著版本研究只要发现矛盾,进而分析这些矛盾,提出各种解释,分析各种可能性,把研究推向前进,就是有意义的,是值得的。
对上述五个问题的研究,虽然可能没有得出令红学界所有人都信服的最后结论,但很明显是有所前进的。
我认为,只要研究有所推进,提出一些新看法,就值得肯定,就是好事,就应支持。
五大名著研究是十分复杂的,深入研究下去,会发现其中矛盾重重。
目前很多学者不愿意研究版本。因为版本中矛盾太多,不管如何研究,都无法得出令人信服的结论。与其做这样无结果的研究,不如去做其他实实在在有结
果的研究,更有成效。
我觉得这种看法虽然有道理,但版本研究也不是就没有前途了。但仔细分析版本研究还是有继续研究的余地的,虽然难度很大,越深入难度越大,但还不是
就没有任何值得研究的了。
我还在坚持研究五大名著的版本,日本也有学者在研究古代小说版本,对此我并不悲观。
古代小说版本是非常复杂的,对古代小说版本研究应注意以下问题。
1.研究古代小说版本不能只举出几个例子就轻易下结论。因为这些例证基本都不是“铁证”,都可能有多种解释,抓住几个例子就下结论,就犹如瞎子摸
象,只看到部分环节就对整体下结论。
2.研究古代小说版本一定要尽可能把证据收集全,以往人工整理,人工比对版本的文字差异,是极其费事的事情,要收集全部证据几乎不可能。
现在版本数字化后,版本文字比对就是轻而易举的事,可以做到逐字比对,从而可以对版本做彻底的分析。
3.在全面、彻底分析的基础上,要特别注意分析多种可能。过去很多学者习惯于,只找到一种对自己最有利的可能,就下结论,而根本不考虑其他可能。这
样的分析和结论都是不可靠的。
4.在多种可能中,要注意研究哪种可能性更大。当然由于角度不同,对哪种可能性更大也会有不同看法。
5.对版本研究也有悲观的看法,一者认为版本中的各种情况,都有多种解释,即“公说公有理,婆说婆有理”,最后没有结果。事实可能确实如此,但仔细
分析,把各种可能都分析透,也是进步。
6.对版本研究的悲观看法还认为,由于不可能找到作者的原本,不可能找到版本演化中的所有版本,因此版本研究是没有前途的,白费力。的确,要找到作
者原本和收集全部版本是不可能的,但这不意味着版本研究就没有前途。
在新方法(如数字化)出现后,研究还是会有进展的。版本研究只要方法正确,就会有进展,虽然有时这些进展可能是很微小的。
《一百二十回本版本研究和数字化论文集》
五、中国古代小说戏曲暨数字化研讨会
从中国古代小说版本数字化研究开始,我就认为这些研究必须相互交流。但如果只靠发表文章的话,推进会非常慢,最有效、最快捷的方法是举办研讨
会,这样学者们可以直接面对面交流。
为此,从1999年《三国演义》版本数字化开始,我就筹备举办研讨会。
2001年在首都师范大学举办了第一届国际研讨会,时隔一年之后,2003年在首都师范大学举办了第二届国际研讨会,从此每年举办一次,一直坚持到今日。
中国古代小说戏曲文献暨数字化学术研讨会从2001年举办第一届以来,已经先后举办过21届,11届在中国大陆,即
2001、2002、2005、2007、2009、2011年6届在北京首都师范大学
2013年在上海复旦大学,
2015年在河北廊坊师范学院,
2017年在北京中国传媒大学,
2019年在湖北师范大学,
2021年在广州大学(线上)。
有10届在中国大陆以外,即:
2004年在韩国首尔详明大学,
2006、2014年在日本东京大东文化大学,
2016年在日本早稻田大学,
2008年在澳门大学,
2010年在韩国首尔成均馆大学
2012年在台湾嘉义大学,
2018年在马来西亚马来大学、德国维藤大学和奥地利维也纳大学,
2020年在德国(线上),
2022年在日本(线上)。
2001—2022年二十一届中国古代小说戏曲文献暨数字化学术研讨会
从2001年由我发起举办第一届“中国古代小说文献暨数字化研讨会”以来,在我一个人的努力下,研讨会得到国内外热心学者的大力支持,能够坚持十几
年,每年都举办,连续举办二十一届是很难得的。这二十一次专题研讨会大大促进了中国古代小说数字化的发展,研讨会对于促进中国古代小说、戏曲文献暨数
字化的交流和研究起了很好的推动作用。
总 结
古代小说版本数字化是研究古代小说版本的重要工具,计算机自动比对可以显示出版本的文字差异,所有文字差异一字不少,全部可显示出来。
计算机自动比对可大大减轻人工比对的劳动,使得学者有更多时间和精力,去从事版本的研究工作。
纸本出版物可以清楚显示各个版本的文字差异,对了解主要版本的整体差异很有帮助。
当然数字化也不是万能的,数字化比对结果最终还是需要人工去研究分析。
计算机只能显示文字差异,而无法进行分析,分析研究还需要人工来进行。因此对数字化既不能否定,也不能估计过高。但数字化肯定对版本研究有很大帮
助是不可否认的事实。
欢迎学者对五大名著主要版本比对本提出意见,以便把这套书做的更好。
《中国古代小说数字化随笔》
文章作者单位:首都师范大学
本文获授权由本公众号首发,转发请注明出处。
本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
0条评论