首页>财经频道 > 正文

轻量化小模型兴起,中小企业也能搭上AI“快车”

来源:工人日报    2025-07-10 10:45:40

随着人工智能快速发展迭代,一些企业开始押注小模型。相较大模型,低成本、上线快、易调试的小模型,以更高的性价比为中小企业和个人用户提供了打开人工智能大门的钥匙。

近两年,人工智能快速发展迭代,大语言模型如雨后春笋般涌现,文本生成、文生图、语音处理、代码处理、视频处理等生成式人工智能走进人们的生活。同时,一些企业开始发力研发可在电脑、手机端训练的轻量化小模型。

“我们需要高铁、飞机、游轮等大型交通工具,也需要私家轿车、公交车,以及摩托车、自行车等小型交通工具。因为在不同场景下,不同人群有不同需求。”在青岛自然语义公司联合创始人、首席架构师孙燕群看来,满足特定市场的需求,是专而精的小模型兴起的重要原因及其存在的价值。

今年3月,自然语义研发的Euler模型通过中央网信办生成式人工智能服务备案。不同于大模型动辄千亿级的参数量,Euler的参数量只有2.5B(25亿),是典型的轻量化小模型。相较于大模型,小模型有何特点?应用前景如何?记者对此进行了采访。

低成本、易调试的端侧小模型兴起

关于小模型,目前并没有明确定义。孙燕群表示,在行业内,参数量低于100B的模型就算比较小的模型。在实际应用时,要想在笔记本电脑端实现微调,模型参数量一般在3B左右。

相较大模型,小模型在算力消耗、使用成本方面更具优势。具体来说,一是训练和推理所需的硬件资源较少,使得成本较低;二是使用更便捷,可在手机、电脑、物联网设备等计算场景中实时运行;三是结构简单,开发者能快速定位问题,易于调试。

记者了解到,随着大模型的比拼日益激烈,一些企业开始押注小模型。2024年8月,微软和英伟达就相继发布过小型语言模型。国内不少企业也开始研发在“断网、弱网”环境下,让各种智能终端具备自主思考能力的端侧小模型。例如,在今年3月举办的中关村论坛年会期间,北京的面壁智能公司就发布了应用于汽车智能座舱的纯端侧超级智能助手。今年1月,广东佛山移动牵头联合40家单位成立佛山市AI小模型产业联合体,致力于通过人工智能小模型提供个性化服务,助力企业完成智能化升级。

“小模型让我们实现了与科技巨头们的错位竞争。”提到小模型的具体应用场景,孙燕群举例说,Euler通过备案后,已经开始面向中小企业和个人用户提供服务。如与山东某市级档案馆合作,上线了档案模型;与青岛当地一家仪器仪表设备公司合作,开发了内网技术相关的模型。

退而求其次后的“主动作为”

“客观来说,大模型的能力强于小模型,一个参数量2.5B的模型无论如何都不可能超过200B模型的算力。”孙燕群直言,这也是大公司都在做千亿级模型的原因。模型小,神经网络参数就少,容纳的知识量不够,“体现在文本生成上,就是容易出现上下文不连贯的情况”。

自然语义最初的目标并不是小模型。2019年底,该公司考虑要做大模型,但由于发展方向不明朗,同时在购买高算力GPU上面临资金和货源压力,因此未能实施。

“没想到,仅过了两年时间,国外的大模型就发布了。”孙燕群回忆说,后来随着越来越多大企业涌入大模型赛道,作为基础硬件的高算力GPU价格水涨船高。“那段时间,听说哪里有GPU,我们就坐飞机去买,常常是提前交了定金也不一定能买到。”最终,公司用10多台设备组成一个算力集群,能支撑做出7B参数的模型。

为了在现有设备基础上尽可能提高参数,自然语义公司工程师经过头脑风暴,想出了新的分词方式,以及将向量计算从实数空间转换到复空间等各种办法。“经过模型训练,这些技术都达到了比较好的效果,能让一个3B参数的模型,达到了150B参数模型60%左右的能力。”孙燕群表示。

中国信息通信研究院人工智能研究所副总工程师王蕴韬告诉记者,小模型之所以能在“瘦身”后仍保持可观性能,得益于一系列成熟的模型压缩与高效架构技术,包括剪枝、量化、知识蒸馏、设计先天高效的网络架构等。

让“小身材”跑出“大能量”

“小模型发展大有可为。”在王蕴韬看来,未来面向特定应用场景的小模型,潜力将会进一步释放。以AI终端为代表的应用形态及产品服务,将成为小模型释放大能力的主战场。

关于小模型的应用前景,王蕴韬进一步解释,一是为离线办公、文档摘要、私密对话等场景铺平道路;二是随着处理器架构和神经处理单元技术的应用,手机、车载和物联网设备将成为小模型的天然舞台;三是在垂直领域与“专精特新”行业,如金融、医疗、法律、教育等已出现6B及以下参数的定制模型,成本低、上线快,可在特定任务上反超通用大模型。

“市场关心的是能否解决实际问题,不关心背后模型细节,能够与场景深度结合,拥有行业知识,尤其是可信的小模型至关重要。”王蕴韬说。

从用户端来看,在实际应用中,小模型的性价比优势也十分明显。北京某互联网公司算法工程师张先生向记者表示,在现有技术条件下,想要在本地部署大模型存在一定难度。“专业GPU芯片价格太高,无法应用到低价格的终端上,如手机、机器人等配备的芯片就无法撑起大模型。另外,这些终端所配备的电池,往往也支撑不了高性能芯片的耗电等。”张先生表示,这些硬件性能有限的终端,更适合小模型施展。

王蕴韬分析认为,未来将是大小模型混合的系统范式。“云端大模型负责通用推理,端侧小模型承担即时响应与私域数据处理。”他还强调,小模型并非“大模型的低配版”,而是面向资源受限环境与专用任务的高性价比解法。通过配合端云混合部署和行业数据精调,企业完全可以让“小身材”跑出“大能量”,在AI商业落地的下一程中获得确定性收益。

关键词:

2025年全国快递业务量突破1000亿件

1000亿件!国家邮政局监测数据显示,截至7月9日,今年我国快递业务量已破千亿件,比2024年达到千亿件提前了35天。至此,我国快递业务量已连

轻量化小模型兴起,中小企业也能搭上AI“快车”

随着人工智能快速发展迭代,一些企业开始押注小模型。相较大模型,低成本、上线快、易调试的小模型,以更高的性价比为中小企业和个人用户提

网购商品退货遭拒 “商品完好”责任谁担

对网购的商品不满意,申请七天无理由退货时却遭到商家拒绝,怎么办?近日,最高人民法院公布一则案例,保护消费者七天无理由退货的权利。刘

市场监管总局召开企业公平竞争座谈会 8家企业负责人发言

据市场监督管理总局网站消息,7月9日,市场监管总局以维护公平竞争市场秩序,促进民营经济高质量发展为主题,召开2025年第四次企业公平竞争

7月10日人民币对美元中间价报7.1510元 上调31个基点

据中国外汇交易中心网站消息,中国人民银行授权中国外汇交易中心公布,2025年7月10日银行间外汇市场人民币汇率中间价为:1美元对人民币7 15

新疆制造!全球首款棉花激光打顶机器人亮相

7月7日,昌吉市榆树沟镇,伴随着嗡嗡声,一个身形矫健的钢铁农夫正忙着为棉花摘帽。当天,由新疆大学联合新疆极目机器人科技有限公司打造的

7月10日央行开展900亿元7天期逆回购操作

据央行网站消息,2025年7月10日中国人民银行以固定利率、数量招标方式开展了900亿元逆回购操作。具体情况如下:

2025年全国快递业务量突破1000亿件

据国家邮政局微信公众号消息,国家邮政局监测数据显示,截至7月9日,今年我国快递业务量已突破1000亿件,比2024年达到千亿件提前了35天。这

《行政区划代码管理办法》出台 如何影响你我

民政部日前公布了《行政区划代码管理办法》,这是行政区划代码管理领域的第一个部门规章,将于今年9月1日起正式实施。这一规章看似专业,实

成都警方通报疑似拐卖儿童纠纷:华阳“人贩子”实为误认亲

据成都天府公安微信公众号消息,成都市公安局天府新区分局发布警情通报称,2025年7月5日12时许,成都市公安局天府新区分局接报警,称华阳街

“丹娜丝”携强降雨继续影响南方 北方高温闷热天气发展

未来三天(7月10日至12日),受今年第4号台风丹娜丝减弱后的残余涡旋影响,江南南部、华南等地强降雨天气持续,福建、广东等局地雨势猛烈,需

洪水过后,这些饮食安全问题要警惕

近期,我国部分地区遭遇洪涝灾害,给群众生活带来困扰。当洪水退去,生活恢复常态时,大家除了要做好排水、清淤、消杀等工作,还需要注意饮

花式骗术迭出,暑期生活如何避坑?

近日,针对暑期高发电信网络诈骗,北京公安部门通报了5类高发诈骗的作案手法,包括机票退改签、兼职刷单、购买演唱会门票、买卖网络游戏账

应聘“中招”?这份求职防骗指南请查收

正值毕业季,一些招聘骗局花样翻新,让求职者遭受损失,甚至沦为犯罪分子的工具人。上海市闵行区人民法院通过梳理既往裁判的案例,总结了一

韩国旅行商深度考察三亚:“海南对韩国游客有很大吸引力”

在韩国人眼中,三亚就是‘东方夏威夷’,这里有清澈的海水、湛蓝的天空、高端的度假酒店和贴心的旅游服务。韩国首尔特别市观光协

黄河水利委员会派出工作组指导山西陕西做好强降雨防范工作

据水利部网站消息,日前,根据水利部工作部署,黄河水利委员会派出2个工作组,赴山西、陕西部分地区指导强降雨防范和洪水防御各项工作。连

我国人均预期寿命提高到79岁

国家发展改革委副主任周海兵7月9日在国新办举行的高质量完成‘十四五’规划首场新闻发布会上表示,我国每千人口拥有的执业(助理)

海外华媒甘南行:拉卜楞寺保护有新章

7月的甘肃甘南夏河拉卜楞寺,正值旅游旺季。转经道上,信徒们手持转经筒缓缓前行,红色的僧袍在人群中不时闪过,来自各地的游客举着相机,

防台风“丹娜丝” 多部门多举措协同配合 筑牢安全防线 守护群众安全

为应对台风丹娜丝,浙江沿海采取了哪些防范措施,来看总台记者发回的报道。在浙江台州玉环市最南端的东沙渔村,这里三面环海,一面靠山,村

“最美新时代革命军人”李兴坤:奋战一线25年的特战老兵

侦察小组,迂回渗透,监视敌方动向!攻心组做好谈判准备,突击二组从后面隐蔽接近……初夏时节,黔中腹地,一场实战化综合演练正在进行。演

文化中国行丨风从尼山来

有朋自远方来,不亦乐乎?风从尼山来,犹如传来春秋时期孔子的问候。7月9日至10日,第十一届尼山世界文明论坛将在济宁曲阜尼山举办,文明对

水利部针对广东启动洪水防御Ⅳ级应急响应

据水利部网站消息,据预报,受台风丹娜丝环流影响,7月9日至11日,广东将出现大到暴雨,其中北部、东部有大暴雨;北江、韩江将出现明显涨水

福建终止防台风应急响应并维持防汛Ⅲ级应急响应

福建省防指决定于9日10时30分终止防台风应急响应并维持防汛Ⅲ级应急响应。今年第4号台风丹娜丝今天9时减弱为热带低压,中心位于宁德市屏南

不断尝试新技术 新疆棉田中“成长”出劳动模范

夏日,天山南北田间地头一片忙碌景象。在新疆生产建设兵团第十三师新星市黄田农场一连棉田里,植棉户姚艳武和徒弟蒋先振俯身查看滴灌设备,

2025“看中国·外国青年影像计划·新疆行”展映仪式举行

2025看中国·外国青年影像计划·新疆行展映仪式,8日下午在位于乌鲁木齐市的新疆大学举行。此次活动由北京师范大学会林文化基金、中国文化

台湾科技大学师生一行到新疆参访交流

台湾科技大学师生一行于6月29日至7月8日到新疆参访交流,分别前往乌鲁木齐市、昌吉回族自治州、巴音郭楞蒙古自治州、阿克苏地区、克孜勒苏

新疆兵团:一线“土专家”为农业生产赋能

下阶段把病虫害管理放在首位,不能出现病虫害,要不然产量会下降。近日,新疆生产建设兵团第十三师火箭农场特聘农技员李艳梅,与种植户一同

四川宜宾山体滑坡失联人员获救

7月9日14时45分,四川宜宾兴文县古宋镇人民村六组山体滑坡失联人员获救,生命体征平稳,正送往医院救治。

宁夏农业农村志出版发行

记者9日从宁夏农业农村厅获悉,《宁夏农业农村志(1996-2020)》目前已由中国农业出版社正式出版。这本农业农村志填补了宁夏农业农村发展从19

云南昭通遭遇特大暴雨 紧急转移7000余名群众

7月8日7时至9日7时,受强降雨云团影响,云南昭通市遭遇大范围暴雨、局部特大暴雨袭击,其中威信县最大降雨量达227 8毫米,刷新该站点自1958

综合资讯

+更多

热点资讯

+更多
从3499元跌到2239元,1.6亿三主摄+1.5K曲屏,荣耀影像旗舰清仓
买手机的用户大致可以分为两类,第一类是追求最新款,秉承着买新不买旧 [详细]

Copyright @ 2008-2020  www.43710.com   All Right Reserved Powered by 财经情报网 版权所有

财经情报网   联系邮箱:562 66 29@qq.com

网站备案:沪ICP备2020036824号-12