一石激起千层浪。
今年初,DeepSeek的横空出世不仅颠覆了AI行业格局,更激起一股人工智能产业发展浪潮。
各地政务系统和大型企事业单位,纷纷开展AI大模型的培训、对接和应用;很多省市密集出台相关政策,全力推动人工智能产业发展。无论地区层面,还是企业层面,都积极行动起来,学AI、用AI,因地制宜发展AI,不甘落后、时不我待的紧迫感越来越强,带动人工智能产业发展进程陡然提速。
在扑面而来的时代浪潮中,一场人工智能产业发展竞速赛正在拉开帷幕。如何在AI新赛道上迎头赶上,乃至打赢这场竞速赛?
“要学会当博导”
3月18日晚上7点,一堂名为《从DeepSeek看人工智能发展趋势》的公开课,在浙江省委党校火热开讲。主讲人、中国工程院院士王坚,面对浙江近30万干部,首先抛出一句灵魂拷问,“未来十年,不懂AI的领导,还带得动浙江吗?”
这是浙江省人工智能通识及应用网络专题培训的开班第一课。听课的有浙江各级党政班子成员,也有省市县三级党校春季学期主体班次学员,还有镇村干部。据统计,在线听课总人数达29.6万。
对于此次培训,浙江高度重视,由省委主要领导提出明确要求并审定方案。培训从3月到6月连开10期,均在晚上进行,从通用知识、产业应用、相关政策、企业案例等方面,深度解读人工智能相关知识。课程包括“DeepSeek大模型实操”“AI政务案例分析”“产业智能化转型”等硬核内容,甚至要求学员现场用AI生成公文、制作PPT、剪辑视频。当地媒体形容,干部“夜学AI,如临大考”。
“面对新技术、新业态、新知识,许多干部不同程度地存在‘本领恐慌’,干部对学习、理解、运用人工智能有着迫切的需要。”浙江省委组织部相关工作人员表示。
不仅是浙江,今年以来,安徽、山东、河南等多地“一把手”带头开展集体学习。苏州、郑州等城市以“新春第一课”的形式,组织领导干部学习DeepSeek。
深圳人工智能培训起步更早。去年10月,深圳就启动了覆盖全员、分级分类、训战结合的人工智能培训,并将“AI夜校”办到了基层社区,在全市掀起“万名干部用AI,百万居民学AI”的新风尚。
培训热潮的出现,是时代发展的必然要求。学AI、用AI不仅可以缓解“AI焦虑”,更能让干部迅速掌握与人工智能发展相匹配的素质能力。
从各地设立的培训目标来看,仅仅会用还不够,而是要“努力在人工智能科技创新和产业发展上走在前列”。这就要求领导干部要从“被动使用者”转变为“主动创新者”,成为AI的领导者,才能抓住时代机遇,掌握人工智能发展和治理的主动权。
未来十年,将是AI时代到来的关键期。正如王坚院士所言,“AI不是一次工具的革命,而是一次科学革命的工具。”“当人们意识到AI可以作为革命的工具时,一轮伟大的变革将会到来。”
在这场变革中,各地既面临前所未有的机遇,也面临严峻挑战。是落后于人还是迎头赶上,将决定一个地区发展的未来。在这种背景下,通过学习和培训,掌握人工智能这一“革命的工具”尤为重要。
“当有博士生水平的AI出现时,要学会当博导,这样才不会出现‘AI焦虑’。”专家说。
抢抓下一阶段“风口”
最近,武汉模态跃迁科技有限公司尤其忙碌。自DeepSeek发布以来,已有美国、日本、新加坡的20多家企业主动寻求合作,希望给大模型应用匹配一个基座方案。
“大模型基座是离千行百业应用最近的环节。以DeepSeek为代表的通用大模型,在产业应用落地,需要很多工具和相关硬件,这就是模型基座要完成的工作。我们在全球范围内都属于前列乃至于领先的水平。”模态跃迁公司首席运营官常元和说。
很难想象,作为企业创始人,常元和今年才23岁。其团队平均年龄不到25岁,大多来自武汉大学。
2023年,模态跃迁成立时,这帮年轻人意气风发,因为团队上一个项目刚被收购,新项目又获得投资,技术、人脉、资金样样不缺。手握先进的AI模型,他们满怀信心地叩响近400家电商企业的大门,但现实却给了他们“当头一棒”:所有企业都只停留在“试用”阶段,没有一家愿意掏钱。产品无人问津,团队很快陷入困境。
“技术再厉害,若不能融入产业,也称不上真正的成功。”于是,他们放下“极客”的骄傲,不再埋头搞技术,而是积极走出去,2024年一整年都在跑应用场景和路演现场。
没想到,今年就迎来了转机。模态跃迁研发的模型在某机器人企业成功应用,还在国内率先将大模型引入游戏电竞行业。
春江水暖鸭先知。相对于地方上的焦虑,行业内企业更多的是兴奋与期待。DeepSeek改变大模型发展格局的同时,更掀起了人工智能应用热潮,让业界看到了AI时代“风口”到来的巨大机遇。
过去,“百模大战”拼的是技术和性能,参数量越大越好,计算能力越强越好,逐渐沦为少数巨头的“烧钱游戏”。DeepSeek以开源和低成本,极大降低了AI进入门槛,加速了AI商业化落地进程,让众多开发者和企业可以一起参与其中,形成更为活跃的AI产业生态。
百度创始人李彦宏说:“人类真正迈入AI时代的标志不在于诞生众多大模型,而在于涌现出大量的AI原生应用。只有应用直接创造价值。”大模型“六小虎”之一、阶跃星辰副总裁李璟也预判:“商业化和应用落地接下来决定行业的竞争格局。”
当前,AI产业发展已从科学家推动转为应用驱动,大模型逐渐向行业垂直深入。下一阶段,机会将在行业大模型、垂类大模型,已成为行业共识。
中国工业体系完备、产业规模庞大、应用场景丰富,为AI应用提供了广阔空间。未来在工业制造、医疗教育、城市金融等领域,都有可能涌现出一批在全国具有领先地位的垂类模型。这对有雄厚产业基础和海量应用场景的地区来说,是发展AI产业的绝佳机会。各地应推动大模型在更多的场景中实现商业应用,力争在行业细分领域打造一批“AI冠军”。
目前,各行各业的垂类大模型竞相涌现。专家预判:2025年将是AI大模型商业应用元年,真正的竞争才刚刚开始。对于大部分地区来说,几乎都处于同一起跑线。新赛道上机遇无限,无需焦虑,只要找准时代的“风口”。
打通AI应用“最后一公里”
从事技术咨询服务的深圳蓝海优利科技发展有限公司创始人李自军发现,2025年春节期间DeepSeek火爆出场后,很多企业也陷入焦虑之中,担心如果导入大模型晚了,会不会丧失竞争优势。但进入第二季度,这种喧嚣有所减弱。
因为第一轮导入大模型的企业,反馈的消息似乎并不太乐观。除了少数行业如文案生成、内容生成类的,可以产生立竿见影的效果,大多数行业导入大模型的试点,往往陷入泥潭。相对于政务领域,企业导入大模型迅速进入冷静期。
从实地调研情况看,目前大模型应用还是以日常效率提升为主,真正要在工业领域得到深入应用,还存在算法精度低、通用性差、专业数据不足、应用能力有限等问题。特别对于中小企业而言,算力成本、部署成本、试错成本高,投入产出比低。
“从企业角度,普遍期望拥有一个可以通用千行百业、快速复制的大模型,以降低成本。然而,由于各行业存在巨大差异,不同场景下开发的模型难以直接应用于其他场景,这使得定制化人工智能解决方案的成本居高不下,难以形成可持续的商业闭环。”专家分析指出,高成本、低回报的局面严重阻碍了企业采用AI技术的积极性。
如何破解这些痛点与难题,打通AI应用“最后一公里”,各地都在积极探索。目前来看,有两种代表性的创新路径:一是推动大模型与重点行业结合,在行业细分领域打造特色适用大模型,让行业大模型成为制造业的“新基建”。
比如,山东省最近实施大模型产业“双百工程”培育行动,聚焦“一行业一模型”开展揭榜挂帅,加快培育“100+”特色大模型企业,打造“100+”优秀的行业级大模型、场景级大模型。
行业大模型建成后,可以通过开放接口,以“云”的形式为行业内的中小企业服务,分享大模型建设成果。中小企业只需要付出少许费用,便可以享受到行业顶尖企业的模型搭建、算法优化等服务,从而破解中小企业在AI应用中的痛点。
二是从算力、算法、语料等关键要素方面破题,构建助推垂类大模型应用落地的功能性平台,降低大模型使用门槛。在这方面,上海已经率先开始探索。
今年初,上海发布人工智能“模塑申城”实施方案,核心举措是聚焦重点行业应用,打造算力、语料、大模型评测与验证中心,以及人才和融资五大公共服务平台,为各类创新主体提供便捷、优质、普惠的公共服务,降低AI应用落地成本。
算力和语料是大模型最重要的“燃料”。随着AI大规模应用,模型后训练和推理需求可能很快会超过预训练算力需求。为了提前做好算力保障和稳定供应的准备,上海市设立国资的算力平台,一方面强化规模化智算集群建设,另一方面提供“训推一体、混合部署”的智算云服务,在保障垂类应用的同时,降低算力成本。
在AI应用中,语料质量直接决定模型的性能。上海市组建了中国第一家人工智能语料公司,按照“一业一方法”建设行业语料库,提供一站式高质量语料服务,让开发垂类模型的中小企业能够零门槛使用数据,从而大幅降低AI应用成本。
除了算力、语料等显性成本,大模型垂类应用还存在基座选型、开发工具链与中间件、评估验证、工程化落地等诸多环节。在这个过程中,企业常常会“踩坑”“交学费”。对此,上海市整合各方资源,在重点行业打造大模型评测与验证中心,减少大模型试验成本,帮助企业高效实现产品化,“企业选择应用就像入店试衣、按需购买”。
在政府推动、各方共同努力下,大模型有望实现从通用场景向行业特定场景、从单点应用向多元化应用的跨越,加速迈向全面应用新阶段,人工智能产业发展将迎来历史性机遇。
延长线:什么是大模型?
大模型是大规模人工智能模型的简称。人工智能(AI)是涵盖所有模拟人类智能技术的总称,包括机器学习、机器视觉、自然语言处理等方向。大模型是AI中基于深度学习、海量数据和算力构建的特定技术形态,属于AI技术的一种高级实现形式。
传统AI专注于单一任务,如语音识别、图像分类等,而大模型通过参数规模(通常达百亿至万亿级别)、多模态能力(语言、视觉、跨领域推理等)突破了任务边界,被认为是迈向通用人工智能(AGI)的关键路径。
根据输入数据(模态)类型不同,可分为语言大模型、视觉大模型、多模态大模型等。
语言大模型是指基于海量文本数据训练、具备广义自然语言理解与生成能力的大规模人工智能模型。在一般的认知中,大模型被认为是通用大语言模型的简称。这是因为自然语言处理(NLP)是大模型技术发展的核心驱动力,早期的AI研究主要集中在文本理解和生成任务上。此外,语言模型的通用性又使其成为其他领域大模型的基础。
视觉大模型是指通过大规模图像数据进行训练,通常用于图像处理和分析的人工智能模型。
多模态大模型是指能够同时处理和理解多种类型数据的模型,如文本、图像、音频、视频、3D等。核心是模仿人类多感官协同认知的能力,突破单一模态的局限性,实现更复杂的交互与应用。未来随着AI技术的进步,多模态大模型将成为医疗、教育、娱乐等领域的核心基础设施。
根据应用场景和功能不同,可分为通用大模型、行业大模型和垂直大模型。
通用大模型是指可以在多个领域和任务上通用的模型,通过在大规模无标注数据上进行训练,以寻找特征并发现规律,进而形成“举一反三”的强大泛化能力,可在不进行微调或少量微调的情况下完成多场景任务,相当于AI完成了“通识教育”。
行业大模型是指针对特定行业或领域的大模型,通常使用行业相关的数据进行预训练或微调,以提高在该领域的性能和准确度,相当于“行业专家”。
垂直大模型是指针对特定任务或场景的大模型,通常使用任务相关的数据进行预训练或微调,以提高在该任务上的性能和效果,相当于“一线员工”。
根据运行载体不同,可分为端侧大模型和云侧大模型。
端侧大模型是能够直接在终端设备上本地化运行的模型,如手机、平板、智能汽车等,无需依赖云端服务器进行计算。
云侧大模型是部署在云端服务器集群上的模型,依赖云计算资源进行训练和推理,通过应用程序接口(API)或云服务向终端用户提供服务。绝大多数用户直接使用的都是云侧大模型。
根据开源性质不同,可分为开源大模型、闭源大模型和半开源模型。
开源大模型是将模型架构、训练代码、权重参数等核心技术资源公开,允许开发者自由使用。
闭源大模型仅通过API提供服务,技术细节不公开。
半开源模型是公开部分权重或训练方法,但完整数据和代码未开放。