您现在的位置:首页 > 杂志 > 2025年 > 2025年第5期 > 特别策划

打破大模型产业应用鸿沟

  作者:课题组  来源:决策网时间:2025-05-20

随着大模型技术的成熟和应用的深入,人工智能开始渗透到各行各业,从制造业自动化到服务业的个性化推荐,从医疗诊断到金融风险管理,AI应用正在重塑传统行业的面貌。

从现状来看,大模型技术成熟度已经很高,但产业应用却面临着巨大鸿沟。与个人日常应用相比,大模型在企业生产经营中的应用要广泛得多,也复杂得多。而大模型在产业特别是企业中得到大规模深入推广,将是大模型真正的星辰大海。

构建产业生态体系

大模型在现实复杂场景中的应用,主要难点在于构建完整的产业生态体系,进而打通大模型应用的“最后一公里”。

在通用大模型基础上,个人大模型和企业大模型快速得到应用落地,行业大模型也在继续发展,是大模型最有价值的商业化方向。现阶段,以个人和企业为核心的大模型产业生态体系正在形成,但行业大模型发展面临诸多挑战。

目前,个人大模型的应用软件已经如雨后春笋般出现,在工作与生活场景中为用户赋能。随着大模型能力的增强和算力芯片的发展,嵌入大模型的个人AI终端产品也已诞生。个人大模型落地背后涉及硬件、软件的技术革新,将个人终端产品拉入新的竞争赛道。

个人大模型的产业生态体系主要涉及数据供给、技术基础设施供给、模型应用、服务与产品供给、安全与隐私等多个方面。在模型应用方面,个人大模型还可以提供个性化推荐、健康检测、生产力工具等应用;基于个人大模型,还有定制应用、智能家居、智能摄像头等产品服务。利用个人大模型,个人可以在学习、工作、生活、娱乐等多个方面提升体验,实现个人生活的全方位升级和发展。

企业大模型的发展,为传统行业带来前所未有的转型机遇。通过深度学习和大数据分析,企业能够更精准地洞察市场动态,优化决策过程,提升运营效率。在这个过程中,企业不仅能够实现成本降低和利润增长,更能够通过流程再造和价值再造,探索全新的商业模式和增长点。这种由内而外的变革,正在重塑企业的核心竞争力。

企业大模型的产业生态体系,主要包括基础层、应用层和战略层三大层面。基础层包括数据供给、数据训练,以及算力集群、储存服务器等硬件和大数据平台、云计算工具等。

应用层主要涉及市场与竞争、投资与财务、合作伙伴与生态系统、研发与创新、供应链、用户与客户等多个领域。其中,通过组织战略合作,可以构建以企业大模型为基础的生态系统。

战略层主要涉及企业大模型的未来与发展、学习与优化、安全与合规三个方面。通过规划大模型的未来发展、持续改进模型性能并保证过程安全合规,推动企业大模型的可持续发展。

行业大模型是针对特定行业领域应用的预训练大模型。目前,制造、金融、医疗、游戏、法律、交通等行业,均凭借各自独特的场景需求,搭建了行业大模型。这些行业大模型的意义在于深入理解和满足行业的特殊场景,为行业智能化、高效化发展提供有力支撑。

未来,随着技术的不断进步和应用场景的拓展,更多行业将构建出符合自身发展需要的行业大模型。

然而,行业大模型的发展仍面临着诸多严峻挑战。

首要问题便是缺乏充足且高质量的行业数据库。对于已经构建行业大模型的行业而言,数据库需要不断得到补充和完善,以适应行业的快速发展和变化。对于尚未构建行业大模型的行业,若无企业牵头并提供丰富的行业经验和资源,构建符合行业需求的数据库将变得尤为困难。

其次,由于行业大模型无法给出可靠、可控的输出,这给那些需要精确、唯一数据的生产场景带来了潜在风险。目前,大模型基于Transformer架构尚无法根本解决这一问题,只能通过不断优化数据与训练方法,努力提高模型输出的准确性。

夯实关键要素支撑

数据、算力、算法和工具,是大模型应用的基础关键要素,它们共同构成了大模型发展的基石。

数据的质量直接影响着大模型训练的成本与结果。随着市场对大模型能力要求的不断增加,对高质量、精细化、定制化的数据需求日益凸显。对于文本类数据集与图像数据集,基于分类、目标检测、语义分割、序列标注等不同的任务也表现出不同样态。AR、自动驾驶等场景的出现,实时图像数据采集和数据自动标注的技术亦在快速发展。

大模型训练数据的来源愈发丰富,数据构建的主体由大模型建设商、数据服务商逐渐向个人、企业、行业主体发展。数据构建由通用向私域延伸,个人、企业、行业构建私域数据集的意识加强。这些推动了数据建设平台的发展,数据传输、整理的工具软件愈发丰富、便捷。

数据交易将推动数据建设平台与数据交易方式逐渐完善,数据版权化意识加强,数据付费成为未来趋势,定制训练数据集的需求激增。根据Cognilytica数据,2021年全球人工智能训练数据市场需求约为42亿美元,预计到2027年将增长到220亿美元。

推动构建高质量数据的同时,要加强数据治理。从企业来看,大部分企业的数据治理工作面临着数据量庞大、数据种类繁多、数据管理效率低的挑战,目前尚未出现通用、可靠的数据管理工具,数据治理仅是企业的单兵作战。同时,加强数据治理也是保障国家安全、社会稳定和公民权益的迫切需要。企业数据如何合理合规,并能保障数据所有者的利益,将是未来行业大模型发展的关键。

算力是大模型落地的物质基础。据预测,2022——2027年,中国智能算力规模年复合增长率将达到33.9%,同期通用算力规模年复合增长率为16.6%。我国智能算力需求的增长速度远超过通用算力增加速度。

大模型落地应用的前提是算力基础设施的搭建。目前,企业应用大模型,如果采用纯自建算力设施的方式,将面临软硬件采购、机房搭建、系统运维等困难,容易陷入投入高、回报低的困境。购买云算力,将成为企业突围算力壁垒的有效途径。

私有云在维护企业数据隐私和业务安全的技术上,能够为企业提供基本的计算服务;公有云可以弥补私有云算力的不足,在通用的场景下进一步满足计算要求。以“私有云+公有云”的方式搭建自身混合算力将成为企业搭建算力的通用范式。

算法是大模型的骨架。当前大模型的主流架构仍是Transformer,未来融合检索增强生成+知识图谱的架构或将成为新潮流。

为了让更多的企业、开发者可以便捷地将大模型应用于自身业务,大模型工具链应运而生。工具链包含大模型训练框架、模型社区、应用开发工具、模型试验与评估、模型试验管理、数据标注、模型部署、模型监控与可监控平台、向量数据库等,可以大致分为服务于模型开发者的模型训练工具、模型调用工具和服务于模型应用者的一体化模型服务平台。

大模型工具的不断发展,将逐渐降低大模型训练和调优的技术门槛,使得大模型训练、调优流程愈发简单。

典型场景应用示范

智能经营管理:某国有大型装备制造企业成立AI团队,按照“技术服务业务发展”的思路,做了深入的业务AI需求调研,总结出23个AI应用场景,并快速展开市场调研与技术预研,最终以渐进式的方式选择提升整体AI形象的交互式人工智能数字人项目作为试点,拉开了企业新型AI应用的序幕。

智能设计研发:国内航空制造企业与第四范式在CAD工业软件上进行共创,引入“式说”大模型,通过语音提问,找到所有与目标设计相类似的三维数模零件,给出多种数模组装方案,使传统的开发形式向数字化转型,提高了研发效率,缩短了研发设计实现周期。

智能供应链管理:顺丰通过大模型技术,推出了多项智慧化服务应用。顺丰小哥服务中心集成了Agent能力,可以驱动API调用和知识库检索,准确提取收寄标准、运费标准、收派操作等问题中的关键信息,为快递员生成简单易懂的业务解决方式;其智能通系统从各国海关官网不间断地爬取、整理、解读最新的关务规则与收寄标准,并自动转译、分析和提炼,帮助员工快速理解和应用复杂的国际贸易规则,显著提升物流管理的效率和服务质量。

智能生产制造:联想在产品质量检测环节,用大模型辅助自动化光学检测系统进行光学检测。如,通过大模型对捕捉到的屏幕图像进行处理,识别出屏幕缺陷,如划痕、污渍、色差等,从而能达到每小时超过300台笔记本电脑屏幕的检测速度,识别更加准确且大大节省人力成本,显著提高生产效率。

工艺优化:某省烟草制造工厂巧妙融入智能体技术,实现从原料加工到成品产出的全流程智能化管理。该工厂开发了专属的人工智能算法和智能体,并建立自己的算法管理平台与智能知识库,使制丝生产线上的设备实现自我监测与调节,并实现产线整线水分稳态预测与控制,有效提升生产精度与效率。同时,构建工艺质量智能管控系统,结合大数据分析与机器学习算法,为产品质量的持续优化提供科学依据。

智慧医疗:成都某综合三甲医疗机构,通过多款智能体和AI应用,显著提升服务品质与管理效率。部署了营销顾问智能体,对销售流程对话的深度语音分析,精准提炼交流精髓,生成阶段性客户画像,为实施标准化、持续性的客户关系管理提供了有力支持。客户服务智能体通过智能分析客户的情绪波动、具体需求及潜在顾虑等信息,定制出更为贴心的诊后服务方案。在医生问诊环节,引入智能辅助系统,能有效沉淀并提炼大量客户交流信息,生成标准化的综合诊断记录,结合多维度的客户画像,智能辅助医生进行数据分析,不仅提高了问诊效率,还显著增强了诊断的专业性和精确度。

智慧教育:河南省某市教体局,通过AI智能体以及教育行业大模型,围绕“教、学、评、管、测”五大业务类,实现18个大模型实践场景。通过个性化教学和即时反馈,教师调整教学内容,学生获得个性化指导,提高了学习效率和兴趣。通过数据统计和分析支持科学决策,优化了学校的管理流程,提升了整体教学质量和管理水平。

(作者为国家工业信息安全发展研究中心标准所、全国两化融合标委会(TC573)、《数字化转型》期刊和联想集团联合课题组)

延长线:

生成式AI :指能够生成新内容的人工智能系统,如文本、图像、音频、视频等。当前最先进的生成式AI大多基于大模型实现,但生成式AI也不必然依赖大模型,而大模型也可分为生成式和判别式。
数据标注 :指对原始数据如文本、图像、音频、视频等,添加标签、注释或元数据的过程,使数据成为模型可理解和学习的“知识”。它是模型训练的关键前置步骤,直接影响模型的性能和准确性。
预训练 :指在大规模未标注的数据上进行初步训练,以学习数据的通用特征和规律,可以节省时间和资源、提高泛化能力、快速适应新任务能力等,是大模型核心技术之一。
微调 :是在预训练的基础上,通过少量标注数据进一步优化模型,使其能够更好地适应特定任务的需求。
蒸馏 :是一种模型压缩技术,通过让一个小模型(学生模型)模仿一个大模型(教师模型)的行为或知识,从而在保持较高性能的同时,大幅减少模型的计算量和存储需求。
基座:是指支撑模型开发、训练和部署的底层技术框架、硬件资源及配套工具,涵盖硬件、软件、算法和工程化能力的综合体系。随着模型规模持续扩大,基座的优化(如降低训练成本、提升能效比)将成为AI竞争的关键领域。
智能体(Agent):指能够感知环境、自主决策并执行动作以实现目标的实体。智能体可以是一个软件程序、机器人,甚至是生物,通常利用大模型作为“大脑”,结合感知和执行模块,形成一个完整系统。

0
最新期刊
X
X