朱伟豪 连荣忠 牛志遥:AI进化与资管投研的新突破

随着国内开源大模型的爆发,AI赋能投研正成为资管行业关注的焦点。2025年5月《推动公募基金高质量发展行动方案》提出强化核心投研能力建设等要求,引导资管行业持续强化数字化资源投入,加快“平台式、一体化、多策略”的投研体系建设。


南方基金权益研究部周期组组长、基金经理助理朱伟豪和南方基金数智科技部资深经理连荣忠、牛志遥共同在《北大金融评论》发文表示,AI技术从人工神经元迈向通用大模型,以“通用智能底座+行业垂类适配”能力,推动资管行业从工具升级走向组织进化。

本文完整版刊登于《北大金融评论》第25期。


随着国内开源大模型的爆发,AI 赋能投研正成为资管行业关注的焦点。文章着眼AI 技术的发展,探讨智能化对未来行业生态的影响,大模型“通用智能底座+ 行业垂类适配”的能力,将如何助力资管行业走向新的发展阶段。


AI技术演进:从人工神经元到通用大模型


“单细胞”时代:感知机—人工神经网络的起点


1957 年弗兰克· 罗森布拉特(Frank Rosenblatt)提出了感知器(Perceptron)算法,这种能够迭代权重的模型,开创了模式识别的新纪元,并在之后发展出组织层级结构的能力;受限于时代硬件条件,其前馈结构能够支持的任务很有限。直到反向传播结构的提出,解决了层级结构中参数训练的效率问题,多层感知机模型开始能够实用化,这种融合统计学、线性代数、高等数学的建模算法的学习潜力被逐步验证,并被学界赋予其一个贴切的名字——人工神经网络(Artificial Neural Network)。


“有丝分裂”时代:残差网络打开深度学习进化之门


随着硬件算力发展,神经网络层级加深,卷积结构(CNN)、循环结构(RNN)等开始涌现。随后AlexNet的激活函数革新以及ResNet 的残差连接设计,提供了深层网络梯度消失解决方案,使神经网络首次突破百层规模限制,平铺的网络开始折叠、异构。随后卷积神经网络CNN 在空间特征提取领域持续突破,并在图像识别领域率先破局;与此同时,循环神经网络RNN在时序数据分析领域显露出处理长程依赖关系的潜力,并逐步孕育了注意力机制的雏形。深度学习的多线发展使得AI 进入“有丝分裂”般的快速进化。


“多细胞生物”时代:Transformer与多模态融合


2017 年Attention Is All You Need 论文提出的Transformer 架构,通过自注意力机制彻底重构了AI 的认知范式,结合Encoder-Decoder 结构使模型能够并行处理全局信息,突破单一深度网络的多种依赖限制;自此,模型开始越来越大,AI 进入“多细胞生物”时代。


一方面在自然语言领域,BERT 通过双向Transformer 编码器实现上下文理解,推动NLP 从传统统计模型向预训练范式转移。这一突破席卷自然语言领域,标志着NLP 领域从传统模型向基于Transformer 的全面转型。


另一方面在专家判别领域,对抗生成网络(GAN)持续发展的过程中,注意力机制融入生成器(Generator)和判定器(Discriminator)的对抗博弈训练,使得小样本输入也能获得较好的细节识别与判定能力。该框架与集成模型的产业应用,共同推动AI 在垂类专业领域判定能力的持续突破。此外GAN 判定器的样本放大机制催生了多种奖励模型及优化机制,为人类反馈强化学习(RLHF)奠定理论基础。


技术的融合进化使得算法能够有效管控越来越复杂的模型结构,指数级增长的参数能够顺着“注意力”有序地传递梯度信息,如同生物器官般协同运作,并在推理环节逐步呈现出类似人类思考的决策痕迹。这标志着AI 进化的新阶段,也为后续大模型爆发埋下伏笔。


通用AI的曙光:GPU算力与大模型爆发


近年来GPU 算力的指数级增长成为大模型进化的加速器, 其并行计算特性与Transformer架构形成完美互补。2018 年后,基于V100/A100 等高性能GPU 的分布式训练系统,使千亿参数模型的训练周期从数月缩短至数周。这种硬件—算法协同进化在2020 年后进入爆发期:代表模型是GPT-3 参数突破1750 亿,并开始展现零样本学习的能力;而2023 年后大模型在图片、声音、视频方面的突破进一步打开了AI 的感知边界,跨模态的推理与生成,让大模型的谈吐才思兼具、绘声绘色。


当前大模型正沿着能力专业化与成本集约化双轨演进,既通过模型微调适配细分场景,又借助知识蒸馏等技术降低部署门槛,为各行业数字化转型提供底层能力支撑。


undefined


大模型在赋能企业数字化转型实践中的主要技术方向


在大模型技术的推动下,企业数字化转型正经历着深刻变革。其中,RAG(检索增强生成)、MCP(模型上下文协议)和Agent 工作流成为推动企业智能化升级的三大核心方向:RAG 通过结合外部知识库与大模型,显著提升了信息处理的准确性与实时性;MCP 打破数据孤岛,实现跨系统的高效协同;Agent 工作流则重塑了业务流程的自动化与智能化。


这些技术不仅解决了传统数字化转型中的信息碎片化、响应滞后等难题,还在金融、制造、医疗等行业催生出智能投研、供应链优化、辅助诊断等创新应用。随着技术持续演进,它们正从单点突破走向深度融合,共同构建企业数字化的智能基座。


RAG检索增强生成


RAG 的核心是将大语言模型的生成能力与外部知识库的精准检索相结合,形成动态知识补充机制。其技术流程包括:


  • 向量化处理切片:将企业知识、研究报告等文档转化为大量高维向量索引,存入向量数据库;

  • 语义检索:通过将用户问题转化为查询向量,基于语义相似度召回最相关的知识片段;

  • 生成融合:大模型结合检索结果与用户输入,生成兼具准确性和上下文连贯性的回答。


这一能力被看做早年动画片中“孙悟空吃书速学”想象的具象化呈现。在实践中:金融领域,投研团队可实时整合市场数据和历史案例,快速检索资料与数据,形成分析材料;客户服务中,企业通过连接产品手册和FAQ 库,实现即时精准答复。


······

《北大金融评论》第25期已经上架

订阅全年刊或三年刊

享独家优惠

扫码订阅→