Home                 Hot Topic      Column       Review                Our Blog            Quotations             About  Us     Events               Join Us                           Bilingual             Link

吴楠:加强数字人文平台建设

  信息时代的学习、教育、研究方式,都发生了前所未有的变化,现代学术研究需主动应对新兴技术给社会发展带来的变化和影响。3月27日,由中国政法大学教师发展中心和中国政法大学人文学院共同主办的“学科素养论坛第二讲:数字人文技术与人文研究”在线举行。与会学者分享了数字技术分析工具的使用方法,探讨了数字人文的发展状况及前景。

  


  数字人文“方法共同体”初步形成


  随着数字人文研究的加速发展,我国数字人文领域不仅出现了学术出版和相关研究项目,而且已经建立起相关专业,人文学者在其中的参与度大幅提高,数字人文研究的“方法共同体”已初步形成。


  浙江大学人文学院教授徐永明介绍了几种数字技术分析工具,包括众包技术、图谱技术、文本处理技术、图像技术、云端技术、AI技术、数据处理技术、数据库技术等。他表示,Python语言在数字人文研究领域的运用,如根据音序笔画等进行排序、把传统纪年批量转换为公元年并核实公元年的准确率、处理新旧字形与繁简字、根据关键词呈现词云等,具有明显的现实价值。他建议学者了解、学习、实践、跟踪这些技术并学以致用。清代学者姚鼐将“义理”“考据”“辞章”作为对人文学者素养的要求,现代人文学者则需要在此基础上增加“算力”等计算机素养,成为集“义理”“考据”“辞章”“算力”素养于一身的研究人员。


  安徽大学文学院青年学者唐宸对明代状元唐皋的研究,体现了影像和全文数字化在文献辑佚方面的作用。他利用中国基本古籍库、国学宝典和韩国古典综合数据库等古籍库检索到文献分布情况,结合传统目录学和最新的OCR技术,累计得到唐皋70篇文章和200首诗歌。


  大数据技术带来的新研究工具,可以扩大研究范围,扩展研究视野。中国政法大学人文学院副教授孙国柱表示,在这个过程中,学术研究不再完全是个体化的存在,而是一个生态性的互动网络。在这样的时代,我们应该尽可能利用新工具辅助研究,促进学术研究创新。

  


  在海量文献中发现新问题


  海量的数字化学术资源大大方便了人文学者的研究。洛阳师范学院历史文化学院教授王国强主要从事汉学史、清史、中外文化交流史、网络资源等方面的教学和研究。他认为,数字资源有助于更快地了解学术动态、学术史,更方便地进行资料收集、整理,如可以更迅速、准确地考证一些汉学家或学者的生平、人物关系、专名翻译等。


  数字工具如何更充分地与人文研究相结合、如何从当今海量的数字化文献中有效发掘材料,成为与会学者关注的焦点。对此,唐宸提到了“远读”这一概念。他介绍,美国斯坦福大学教授弗朗哥·莫莱蒂提出,传统的“细读”(又称“近读”)以极其严肃的态度对待极少量的文本,导致大量文学作品从未被研究者阅读。如果想要理解整个体系,就必须采取“远读”的方法,聚焦比文本小很多或大很多的单位,比如词语与文类识别、句子与风格、量化分析。文本标记和挖掘,是数字人文“远读”的重要手段,能够让学者发现传统阅读方式无法发现的问题。在古典文学与文献学领域,相关探索也已展开。


  清华大学人文学院教授刘石与首都师范大学中国诗歌研究中心专职研究员尹小林利用字频词频统计印证“文笔之辨”“诗分唐宋”等概念话题,得出了一系列有趣结论。例如,在《三国演义》与《聊斋》中高频率出现的“曰”,在《西游记》和《水浒传》中被“道”取代,而到了《红楼梦》中,“了”“的”等虚词也成为高频词。这些反映出小说文言色彩的不断减弱和白话转型的到来。


  基于自然语言处理的深度学习技术,近年来也成果频出。如清华大学计算机科学与技术系教授孙茂松及其团队发布的“九歌人工智能诗歌写作系统”和“类义句搜奇”,让更多目光聚焦数字人文研究。

  


  跨学科形成“学术共同体”


  为他人提供帮助,降低技术使用门槛,是所有数字人文学者共同努力的方向。因此,学界也越来越重视数字人文网络基础设施建设。徐永明主持搭建了浙江大学“大数据+学术地图创新团队”和“学术地图发布平台”。唐宸及其团队共同开发了中国古典文献资源导航系统和数字人文门户网站。“我们要多一些为他人做嫁衣的精神,做出更多平台、更多工具,将各类有用的数据库和数字人文工具聚合在一起,降低学者利用数据、接触前沿技术的门槛,吸引更多人加入数字人文研究行列,让数字人文成为人人都能运用的技术。”唐宸表示,数字人文是一个新概念、新领域,跨学科形成“学术共同体”是数字人文研究的应有之义和必由之路。


  湖南大学岳麓书院副教授战蓓蓓表示,随着信息技术专业化程度的提升,数字人文研究既需要更多的参与者,也需要更多的团队合作。面对不同的知识结构,团队成员要在一定程度上抛弃偏见,真诚交流,开阔视野。


  徐永明提出,古籍数字化和智能化是大数据时代发展的必然趋势。但无论是纸本文献数字化,还是文本数据结构化和智能化,都还要经历一个漫长的过程。这需要广大学者和从业者具有大国工匠精神,孜孜以求,默默奉献。我国要在数字人文领域获得国际话语权,必须大力推进数字基础设施和大数据建设,夯实数字人文发展基底。




(来源:中国社会科学报)


2022年4月6日 16:53