樊文飞:全栈AI驱动的金融科技——算法、数据、基础设施

当前,人工智能技术迅猛发展,以大模型为代表的AI系统在推动产业变革的同时,也面临数据幻觉频发、数据依赖性强、可解释性不足等严峻挑战。在这一背景下,如何突破技术瓶颈、推动AI在关键领域的可靠落地,成为学界与产业界共同关注的焦点。2025年9月12日晚,北京大学汇丰金融研究院特邀深圳计算科学研究院首席科学家、中国科学院外籍院士樊文飞院士,就“全栈AI驱动的金融科技:算法、数据、基础设施”展开深度解析,探讨在算力、算法与数据三大维度中实现突破的可能路径。北京大学汇丰金融研究院副院长马琳琳教授出席并致辞,共同探讨大模型的应用问题。


马琳琳教授发表致辞


讲座伊始,北京大学汇丰金融研究院副院长马琳琳教授代表学院致欢迎辞。她首先对樊文飞院士的到来表示衷心感谢,并对现场听众表示热烈欢迎。马琳琳教授指出,在人工智能推动行业深刻变革的今天,大模型的应用局限亦不容忽视,如幻觉现象、缺乏可解释性等瓶颈问题,制约了AI在工业与金融关键场景中的潜力释放。随后,她隆重介绍了樊文飞院士的学术成就与社会贡献,以及北大汇丰金融研究院的使命与成果。她期待本次讲座能深入剖析AI在金融科技与数据基础设施中的核心挑战与机遇,为大家带来启发。

undefined

樊文飞院士介绍全栈式AI系统

樊文飞院士从当前大模型的技术局限性切入,指出其虽在多项任务中表现突出,但仍存在不可解释性、幻觉现象、对小样本数据适应差等根本问题。他强调,特别是在金融、制造、医疗等高风险领域,缺乏逻辑保障与推断透明度的AI系统仍难以承担核心决策任务。为此,他提出应融合逻辑推理与机器学习,发展全栈AI技术体系,在准确性、公平性、鲁棒性等多重标准间实现更好平衡。

樊文飞院士系统介绍了其团队自主研发的三套核心系统——面向AI的可信数据质量系统“采石矶”、底层基础设施“崖山数据库”以及智能数据分析系统“钓鱼城”,并结合银行风控、电池制造、烟草配方、生物制药、网络安全等多个真实案例,阐释如何通过逻辑嵌入与规则自动发现,在小样本场景下实现高精度、可解释、低成本的决策支持。他指出,在金融反欺诈、贷款审批、产品推荐等典型场景中,该系统可实现模型精度从29%提升至74%、召回率翻倍等显著效果。

在数据基础设施层面,樊文飞院士尤其强调高质量语料与修复技术的重要性。他提出,“数据质量不亚于算力中心”,并以团队开发的“采石矶”系统为例,展示如何实现数据错误自动发现与可信修复、以及如何通过提升数据质量显著增强模型训练效果。他还展望了数据资产化、跨境数据合规等前沿议题,指出中国在基础软件与数据技术领域仍须摆脱开源依赖,实现底层原创与系统自主。

undefined

现场观众座无虚席

在提问环节,现场观众围绕“逻辑-统计融合算法的跨行业适应性”“崖山数据库在国产化替代中的进展”“AI在垂直领域的落地瓶颈”等问题与樊文飞院士展开探讨。他指出,技术路线选择需基于具体场景与资源约束,呼吁学界和业界摒弃“大模型万能”迷思,重视基础研究与跨学科协作,尤其在高端基础软件等领域实现真正突破。

undefined

现场观众踊跃提问

本次讲座不仅深化了听众对AI底层逻辑与基础设施的理解,也为金融、制造、医疗等多行业实现AI转型提供了理论支持与技术路径参考。北大汇丰金融前沿讲堂将继续聚焦科技与金融前沿交叉议题,为构建开放、理性的学术交流环境持续发力。

undefined

樊文飞院士、海闻教授与工作人员合影留念

此次讲座是“北大汇丰前沿讲堂”的第127期。“北大汇丰金融前沿讲堂”由北京大学汇丰商学院主办,北京大学汇丰金融研究院承办,《北大金融评论》和深圳市资产管理学会作为学术支持。“北大汇丰金融前沿讲堂”将继续邀请业界权威人士讲授金融前沿领域的理论知识与实践经验,为北大学子打造聚焦金融市场最新趋势与动态的优质平台。

(撰稿:张嘉良)