从数字史学到数智史学：技术变革下的学科反思与创新-刘枫的专栏

从数字史学到数智史学：技术变革下的学科反思与创新

2026-06-26 12:16:12栏目：优秀博文 IP属地：IP未知

人工智能技术正深刻重塑着人文学科的研究范式。面对这一“变局”，作为传统文科的历史学也无法“置身事外”，既要面对史料规模激增、研究方法快速迭代的挑战，也迎来了数据爆发和技术赋能的重要机遇。大语言模型、图像识别、社会网络分析、知识图谱等技术的大量涌现，为史料整理、文本分析、关系挖掘、空间复原甚至历史阐释提供了全新的路径。

与会者合影

不过，史学界对人工智能的认知与应用仍处于起步阶段。历史学者如何在坚守史学传统的前提下，有效吸收人工智能技术带来的方法创新，已成为当前史学研究与新文科建设的重要议题。为推动历史学与人工智能、数据驱动的交叉融合，促进学界围绕AI赋能历史研究的路径、方法与伦理展开深入研讨，上海市历史学会、上海师范大学人文学院与上海师范大学都市文化研究中心于2026年6月20日联合举办了“从数字史学到数智史学：技术变革下的学科反思与创新”学术研讨会。这次活动也是上海市社联2026年度合作项目之一。

会议开幕式由上海师范大学人文学院蒋杰教授主持。上海市社联学会处杨琳副处长与上海市历史学会副会长、复旦大学历史地理研究中心张晓虹教授先后发言，对各位与会专家、同学表示热烈欢迎。张教授指出，方兴未艾的数字技术，已从辅助性角色演变为重塑史学研究范式的结构性力量。数字史学历经了从计量数据库，到历史地理信息系统，再到知识图谱等多个阶段，实现了从数字化存储到智能化理解的跃迁。人工智能技术的快速发展，将史学工作者从机械的重复性劳动中解放出来，形成了“机器处理史料、学者思考历史”的人机协同研究模式。但在特定的历史语境中，人工智能技术在真伪辨析、因果判断和史实诠释方面仍存在很大局限。因此，史学工作者的角色仍不可取代。在这个过程中，历史学者仍必须坚守史学方法与人文价值。她还提到，上海在中国的数字史学发展中占据重要位置，这座城市不仅拥有CHGIS（中国历史地理信息系统）这一数字史学的标志性项目，同时也具备资源集聚的优势。未来应搭建跨学科平台，培育复合人才，推动“人工智能+历史研究”向纵深发展。

开幕式结束后，会议进入学术报告环节。南京大学历史学院王涛教授在题为“数智史学时代传统史学技能的辨析与维护”的报告中指出，在人工智能迅速发展的今天，历史学者的基本功训练反而变得尤为重要。技术越是发展，历史学者就越需要坚守历史学素养，并建立起某种传承机制。他重申，历史学应回归自身的核心素养，并强调史实考据、文献批判等基本技能是不可替代的。历史学者的真正价值在于从史料到史实的逻辑分析与价值判断。这一过程既需要扎实的史学素养，亦需要与人工智能技术协同，但意义生成的主导权应始终掌握在历史学者手中。

针对人工智能如何与史学研究相结合的议题，南开大学历史学院马思宇老师进行了题为“从数字存史到数智释史：中国近现代史研究的范式变迁与实践路径”的报告。他指出，中国近现代史研究已从“数字史学”阶段进入“数智史学”阶段。前者仅限于史料数字化与工具辅助，后者则转向主动的“智能释史、算力证史”。他还详细介绍了数智史学特有的数据智能理解、关联智能推演、语境智能还原以及叙事智能重构等四大特质。在实践层面，通过史料挖掘、历史空间重建及社会网络关系推演，智能体可以有效赋能史料溯源、因果论证与历史阐释，推动研究从单纯的史实描述走向系统性解释。与此同时，他也指出数智史学存在史料失真、阐释泛化以及人文弱化等风险，强调必须建立“技术赋能与史学本位相统一”的规范，确保智能工具服务于史实考证与意义阐释，而非替代历史学家的专业判断。

南京大学历史学院金伯文老师基于南京大学数智文献实验室的实践，探讨了人机协作撰写史学论文的可行路径。他指出，大语言模型在历史研究中面临语料匮乏、幻觉频发与上下文限制三重困境。为此，南京大学数智文献实验室搭建了“数智文献处理平台”，支持学者自主构建专业史料库，并集成文献智能摘要、专项知识库及检索增强生成与多智能体协同技术（RAG+Multi-Agent），实现基于可信史料的专业问答。他以《皖南事变军事前因再考》一文为例，演示了人机协作撰写论文的具体流程：学者提出方向性问题并划定史料范围，AI负责长编、大纲与初稿的生成，学者则负责把控问题意识、逻辑框架与史料核实。实践证明，大语言模型能高效承担史料整理、初步梳理等劳动密集型工作，极大地提升了写作效率，但高水平的问题提出、因果推断与理论升华仍完全依赖学者的专业素养和历史学基本功。金伯文强调，人机协作必须以扎实的传统训练为根基，AI是辅助工具而非替代者，唯有在技术与人文之间保持平衡，才能发挥数智平台的最大效用。最后，他强调AI在发现历史学“兴趣点”方面存在不足，这是历史学者需要注意的，加强历史学基础素养训练依然具有意义。

中国人民大学历史学院张燚明老师介绍了该院“文史资料数智平台”的建设实践。文史资料的系统整理与出版，源于周恩来总理的亲自推动。60余年来各级政协积累了海量“亲历、亲见、亲闻”的历史资料，是中国近现代史研究的信息宝库。“文史资料数智平台”建设团队收集了3万余册各级文史资料，借助大模型实现高识别率文献数字化，并自动提取历史人物、时间、地点等关键信息节点，在减少人工干预的同时积累海量的纯净语料。平台定位于检索迅捷、图文并茂、内容可靠的全文数据库，通过调用大模型能够实现摘要自动生成、时间轴与人物关系图谱构建等功能。在此基础上，团队计划围绕海量语料进一步打造更专业的文史资料智能体，实现从“数字化存史”到“智能化用史”的升级。张燚明强调，“数智平台”的建设既要充分利用人工智能提升史料处理效率，也必须确保文献识别准确性与内容可靠性，他们的最终目标是为中国近现代史研究提供兼具广度与深度的基础设施。

此后，蒋杰教授进行了题为“结构、网络与行动：基于数据驱动的上海总商会系统研究（1902—1929）”的报告，他以1902年至1929年的上海总商会系统为研究对象，利用会员名录与《申报》文本，分别从组织、事件与网络三个层面考察了“总商会系统”的组织构成、行为模式与权力机制。在组织构成方面，他发现在1909年至1927年间“总商会系统”实现了规模的迅速扩张与人员的大量更替，但成员的代际、年龄、行业与地域构成等核心要素却日趋集中。在社会行动方面，通过系统挖掘《申报》语料库中与总商会系统相关的报道，可以发现这一商业精英组织频繁介入五四运动、五卅运动以及北伐等重大政治与社会事件。借助社会网络分析的方法，他发现“总商会系统”处于连接政府、金融机构与地方商会的中心枢纽位置，但这并非一张高密度网络，而是通过少数高中心性节点实现跨地域、跨行业连接。

来自复旦大学历史地理研究中心的李爽老师，进行了题为“历史城市地图的智能生成、空间推理与智能体协作”的报告。她指出，AI智能体已从“对话交互”进入到“任务执行”的阶段，这为历史城市地图研究提供了新的技术路径。她集中探讨了图像生成、空间推理与智能体协作在历史城市地图研究中的应用。在图像生成方面，她借助多模态模型，通过自然语言提示词实现了历史地图生成、风格迁移及城市空间扩张的展示。在空间推理方面，她将大模型与老上海地图和历史建筑照片相结合，成功反推出老照片的拍摄位置，实现了历史地名与城市景观的空间匹配。在智能体协作方面，她借助“Vibe Coding”与AI编程助手在4小时内搭建起了集成多源地图的近代上海城市复现网站，并快速生成“海上百年”城市演变展示网站。此外，她还尝试通过QGIS命令行接口自动完成制图与地理学分析。在报告的最后，她提出了使用AI的四点建议：保留证据、约束生成、记录执行、注意权限。

复旦大学历史地理研究中心柴宝惠老师进行了题为“人工智能赋能上海旧志知识挖掘”的报告。她以上海府县旧志丛书为研究对象，将数字人文技术与历史地理学相结合，尝试解决地方志文本中历史地名信息的智能化提取与知识组织问题。她认为，通过自然语言处理与知识图谱技术可以实现“深层知识发现”，将静态的文本记载转化为可计算、可推理的结构化知识体系。她的研究基于“炎黄”多模态大模型与命名实体识别技术，构建了从文本到知识的全流程处理体系，目前已标注203089个实体，包括历史地名52937个、人物101346位、物产16201种及建筑32605座，并挖掘出134099条多元关系，完整还原了上海地区历史地名演变与人地互动网络。该成果不仅为上海历史地理研究提供了标准化的时空数据基础，也为大规模方志知识图谱构建及AI与文献整理的深度交叉提供了可推广的方法论路径。

综合讨论是此次会议的第二个环节，与会学者围绕人工智能背景下历史学的发展路径展开了热烈而深入的讨论。议题涵盖人工智能技术在历史教学中的应用、历史学者是否需要具备编程能力、AI辅助研究的学术诚信与署名伦理、传统学术评价体制在人工智能时代的有效性以及学术期刊的应对策略等多个方面。关于AI融入教学，学者们普遍支持AI融入课程教学，但关于具体路径仍存在不同看法。复旦大学历史地理研究中心孙涛老师将AI浪潮与此前的GIS热潮进行了类比，他认为“AI恐慌”将随着技术成熟而自然消退。蒋杰则认为，AI技术相较于GIS的准入门槛更高，且还处于快速发展之中，因此短时期内这种恐慌可能难以消失。他支持将人工智能技术引入历史教学，但一定要注意时机的选择。他结合自身教学实践指出，过早让学生将AI技术与史学研究相结合，容易导致学生急功近利，不再愿意潜心阅读史料，无法培养起历史工作者必须的“历史感”。来自华东师范大学历史学系的苏圣捷老师分享了自己的实践经验。他指出，目前邀请计算机等相关学科老师来为历史系学生讲授人工智能技术的课程，仍存在一些暂时无法克服的困难。这是因为理工类背景老师的“结构主义”思维方式与历史系学生“功能主义”的需求存在本质矛盾。在具体实践中，他主张AI阅读应区分知识提取型与论证学习型书籍，并建议经典著作不宜借助AI阅读。

考核方式变革是学者们讨论的焦点之一。苏圣捷指出目前的AI检测工具既不可靠，意义也十分有限。他指出，可以采用“过程性考核”方案，即采取课前课后两份报告相互对比的方式，以此评估学生将人工智能技术与史学研究相结合的能力。马思宇老师亦支持过程化评价的模式，但在具体实践中与苏圣捷老师存在一定差异。他建议课程的考核在学期中段就开始，采用小组协作方式完成数字史学项目。这种考核方式既可以培养学生使用AI的能力，也可以让学生有获得感。

史学工作者是否需要学习编程知识，亦引发与会学者及听众的热烈讨论。面对学生的普遍焦虑，蒋杰认为，史学工作者只需要掌握编写代码的基础知识，具体问题可以通过AI交互解决。至于“文科编程”课程的问题，他建议广大同学可以借助网络资源学习一些基本的编程知识，然后在实践中不断提高自身的编程能力。王涛也主张学生应具备阅读代码的能力。苏圣捷指出，学生应当具备“产品经理”的思维，先明确自身的需求与流程，之后再去学习阅读代码。与以上学者不同，张晓虹教授则以智能手机逐步取代摄影相机为例进行类比。她认为，人文学者无需过于追求编程能力，随着AI的不断发展，这种编程门槛会逐渐消失。她强调AI只是辅助工具，数智史学的落脚点始终是史学。金伯文分享了AI评审耗时远超专家评审的个案。他指出，人文学者目前还要学习编程的现状，恰恰说明了AI技术尚不成熟。随着技术持续发展，这一门槛终将逐步降低。

在学术诚信与评价体系方面，王涛指出要求作者说明AI贡献度的做法难以有效核验且意义有限。张燚明则强调了原始数据提交与核验的透明化规范建设，这样可以使每篇论文的论证起点有据可查。马思宇则提醒，审稿环节如果引入AI辅助，可能存在的信息泄露的风险。关于评价体系，王涛指出在AI的辅助下，史学论文大量产出对传统史学论文价值构成了破坏。为此，他主张推动评价体系多元化改革。马思宇呼吁严格区分AI工具性价值与史学家学术创新价值，防止“没有门槛”的史学文章泛滥挤占有深度思想空间的文章。张晓虹重申系统性的史学训练，所形成的历史学素养不可替代，这是学科身份认同的根基。蒋杰亦指出，AI技术的发展势必会缩短史学论文的撰写周期，突破史学家原本无法突破的创作上限。这必将对论文发表和学术评价造成强烈冲击。如果这种状况真的出现，不仅无助于推动“数据平权”，可能还会造成更严重的学术不平等。

在会议总结部分，与会学者一致认为，人工智能正在深刻影响历史学研究的方法论与学术生态，但人工智能始终是辅助性工具。历史学的核心在于历史学者所具有的人文关怀、思想深度与扎实的史料功底。如何在技术赋能中守住学科底线、优化评价体系、培养兼具数字与史学素养的新一代研究者，是当前历史学界亟须共同探索的重要课题。蒋杰教授最后指出，本次会议虽为小型学术聚会，但其讨论的深度与前瞻性已初步显现出学术史的意义。当前，数字史学正处于“群雄逐鹿”的时代，正需要同行学者通过真诚交流，积极分享各自的教学经验与研究探索，为历史学在智能时代的转型提供切实可行的路径。此次会议在意犹未尽中落幕，也为后续持续对话与合作留下了充分的空间。华东师范大学学报编辑部田润老师，上海师范大学人文学院曹嘉君老师亦参与讨论。

来源: 澎湃新闻