世界迎来了数智化时代。当数字和智能碰撞,当文学与数据双需,当下古代文学研究又将何去何从?
近日,四川大学文科讲席教授、博导,中国词学研究会会长王兆鹏做客绍兴文理学院风则江大讲堂,作了主题为“数智时代文学研究的新路向”的专题讲座,用具体实例分享如何运用数据化、可视化和智能化的技术方法来研究古代文学,拓展古代文学研究的新路向。
数智化时代中的文学研究
随着人工智能的发展,数字人文已由数字化发展到数智化阶段,对古代文学的研究,也跟上了时代的发展步伐,前景广阔。早在 2011年,王兆鹏就推出了一部著作《唐诗排行榜》,书中运用统计学、传播学等理论方法进行测评,得出了一份唐诗前100名的排行榜,其中排在榜首的是崔颢的《黄鹤楼》。2017年,王兆鹏主持制作的“唐宋文学编年地图”上线运行,这样一种利用数字化电子地图跨学科打通古今时空维度,实现时空衔接的做法,再次在学界引起轰动。
讲座中,王兆鹏从数智时代的变化谈起,结合当今时代计算机功能的变化和学术思维的变化,提出了以问题需要为中心、融合各学科知识的反学科思维,在此基础上指出了数智化时代文学研究的三条基本路向。
一是数据化。数据化不仅是大数据时代和人文社会科学研究的必然要求,也是学术创新的需求。各类目录文献、文本文献均可作为数据化的提取来源。这些文本数据,不仅可在人工智能支持下,依照姓名、生卒年、作品数量等主题生成相应内容,而且可用于论文写作,为读者提供海量的古籍资源。“在大数据时代,我们要形成数据意识。只要有了数据意识和数据眼光,借助人工智能手段,挖掘数据已经不再是难事,关键是我们要有这种意识和善于运用。”王兆鹏说。
二是可视化。读屏和读图的时代,阅读方式的变化,文化传承载体的变化,对古代文学研究提出了新的时代要求。王兆鹏认为,可视化在于数据的图形化与地图化,这需要学术、美术和技术的共同协作。他以唐代著名诗人籍贯分布和活动行迹的动态图形展示了数据图形化的形象性,以呈现唐宋文学编年地图说明了数据地图化的便捷性。
数智化时代对文学研究的启示之一就是学术思维的变化,需要研究者以问题需要为中心,融合各学科知识——当我们打破学科思维,对诗歌的理解就会更深入。比如,面对王维的诗句“人闲桂花落,夜静春山空”,文学专业的人会问,这句诗描写的是什么意境?生物学的人可能问,这里写的什么品种的桂花?在我们日常的生活中,桂花是秋天开,怎么在春天还在花开花落?这就涉及到生物学、植物学的问题。桂花怎么栽培?涉及到土壤学、气候学等。
“数字化已经到了智能化的时代,但文学领域做得还不多,需要大家参与。有一定的难度,但只要进入,就会有一定的收获。”王兆鹏说。
用实景地图探索文学现场
这几年,我们常说一句话:诗和远方。而大数据与可视化地图证明了这点,诗在路上,诗在远方。
数据的地图化可以全景呈现一个时代的作家活动、文坛图景,从而改变文学地理空间的认知方式。比如,绍兴文学的空间是三维的,并非一维,“绍兴人的文学”和“在绍兴的文学”都可以进入绍兴的“文学地图”。另外,数据地图还可以细化文学史的时间粒度,寻找历史进程的时间节点。
唐代诗人韩愈有一首诗《左迁至蓝关示侄孙湘》中写道,“云横秦岭家何在?雪拥蓝关马不前。知汝远来应有意,好收吾骨瘴江边。”为什么在“蓝关”这个地方马就不走了呢?当把这首诗定位定在现在的西安市蓝田县,5公里开始上坡,在横亘秦岭的蓝关古道上,一侧是起伏的群山,另一侧可以俯瞰白鹿原。通过在山岭上航拍,我们可以看到,连绵群山中只有山脊相连,韩愈牵着马在陡峭的山梁上行走,大雪封路,而朝廷规定他必须在规定时间内赶到被贬之地潮州,否则要严加惩处。
“这几句诗,我们以前轻轻地就读过去了,当我们看到现场的时候,就会了解作者在什么情况下写这首诗,写的是什么,我们才知道其中所包含的沉痛。”王兆鹏表示,诗人的很多心情是在文字之外的,读诗不能仅仅凭阅读经验,必须进行深度解读,数字地图有助于我们定位和了解现场,理解古代诗人在诗歌当中所写的场景和包含的心情。
用知识图谱“玩转”唐诗宋词
一点击“陆游”,他的“朋友圈”就出来了;点击“李白”,他的旅行行迹图就有了全景展现;研究一篇作品,历代评注就像互联网的留言一般一一呈现……当知识图谱遇到唐诗宋词,就会碰撞出不一样的烟火。
世界是复杂关系的总和,知识图谱则是对复杂关系进行建模的一种方法。2012年,Google(谷歌)在它的搜索引擎中首次引入“知识图谱”:用户除了能够搜索到相关网页,还将看到与关键词有关的更加智能化的答案。人们对世界的认知,进入了智能化的关系时代。
王兆鹏表示,文学研究的智能化,是以“知识图谱”为主要阵地的数据智能化的呈现。他的研究团队推出了古代诗词“知识图谱”平台(https://cnkgraph.com),对文本文献有着自动笺注、自动统计数据、自动呈现图形等十大显著功能,并向公众免费开放。
不同于以往的诗词数据库,知识图谱一方面依靠古代文学专家制订的诗歌知识框架,另一方面,基于自然语言处理技术实现了大规模的知识挖掘,对诗歌的主题、情感、风格,诗人的轨迹、社交关系等都实现了全方位的抽取和可视化呈现。
子曰:诗可以群。诗人之间相互唱和、通过诗歌进行人际交往和情感交流是一项重要的创作传统。唐诗作为中国古典诗歌艺术的巅峰,亦是实现“诗可以群”这一功用的重要舞台。“知识图谱”将诗人之间应酬唱和的数据抽取出来,犹如构建了一个璀璨的星系,调整右上角的核心诗人节点数量,可以看到不同规模的星系图谱如何形成。
“当代的文学研究必须是紧扣时代主题,突破传统研究方法的局限,充分利用大数据、人工智能等新技术、新方法,进一步打破学科壁垒,这样才能让古老的学术焕发出时代的生机。”绍兴文理学院人文学院副院长刘亮说。(记者:董晓晓)
全文链接:http://epaper.shaoxing.com.cn/sxrb/pad/content/202403/27/content_519685.html