山东:大模型加速走出“对话框”
今年5月,全球权威赛事QASC挑战赛更新国际排名,浪潮海若大模型以93.70%的准确率刷新世界纪录,斩获榜单第一。也是在5月,崂山实验室、中国科学技术大学、青岛海洋科技中心、青岛国实科技集团等推出“问海”预报大模型,进行未来15天的全球三维温度、盐度、流场预报只需耗时一分半,而在传统数值模型下,需要两个小时。
大模型不仅仅是“对话框”里的知所需答所问。当前山东有大量数字技术企业、行业龙头企业在加大研发力度,推动大模型走出“对话框”,深入产业端。从技术到应用,山东的大模型产业正加力提速。
或可凭借轻量应用“抢跑”
身体状态、过往病史……基于与患者的沟通,医生会形成入院记录、查房记录等病历文书,但相关文书整理工作往往占用大量时间精力。“应用海若医疗大模型,通过识别医患对话,目前15秒可完成病历生成,准确率在90%左右,减轻医生70%的工作量。”浪潮云首席技术官孙思清介绍,这样一份电子病历背后是模型对海量医疗数据的深度学习,再通过语音识别、分析转写、病历生成、病历质控、确认导入五个环节实现自动生成。
家政服务品牌“阳光大姐”也已开始与“大模型”亲密接触:基于20余年行业知识与数十万服务员的实践数据,丽阳神州智能科技有限公司与阳光大姐联合打造国内首个家庭服务产业大模型。丽阳神州技术负责人史吉东介绍,虽然大模型目前还处于知识增强阶段,主要解决提升服务品质、解决供给缺口等问题,但未来瞄准的其实是全面融合物联网、智能家居设备和服务机器人等技术,实现家庭场景的全链接、全周期等服务。
今年6月,山东出台大模型领域首个高质量发展指导意见,为产业发展明确路线图、任务书、施工表。这是政产研三方多次面对面交流、开展头脑风暴的结果。以5月下旬的一次座谈为例,创新速度快是这场座谈释放出的鲜明信号:除了药物研发、矿山开采、车型设计等相对专业的领域,深入百姓日常生活的大模型案例也越来越多。去年底的数据显示,山东已发布1个基础大模型和11个行业大模型,数量居全国第七。
“山东有大量企业在加强大模型创新研发,大量产品涌入市场。”省工信厅数据产业推进处处长、一级调研员孙志强介绍,有别于不少智能化领域要采取自上而下、由大及小的赋能路径,针对特定用途的轻量化模型给予了中小型企业更多“入场”机会,如能配套针对性政策措施,就有可能在较短时间内实现大规模推广应用。大模型以“鼎新”带动“革故”的效用也因此被寄予厚望。“通过发展大模型,不仅是传统行业转型,传统的数字企业也能进一步成长为大模型企业。”孙志强说。
积极应对数据算力两大挑战
相比供给端在细分赛道“百花齐放”,需求端应用大模型的意识才兴起不久。“有大模型只是第一步,只有在细微场景中不断积累经验,才能产生优质的大模型。”自然语义青岛科技有限公司项目总监钟佩佩认为,这意味着,大模型必须通过提升性价比来强化需求端使用意愿,但目前看,数据、算力是摆在面前的“两座大山”。
大模型的惊艳表现背后是对高质量数据集的持续供给和解析,尤其是那些需要100%精度的模型。初步测算,在一个行业形成一个数据集,投入通常在5000万元以上。“成本压力很大,但不做,模型就发展不下去。并且如果不能持续从现场获取数据,模型将很容易出现退化。”云鼎科技股份有限公司工业互联网事业部副总经理王磊表示。总体看,山东数据资源规模巨大,但质量参差不齐,且数据要素市场化程度不高,制约了数据高效流通及应用。
看得见的应用背后,是看不见的算力在“飞奔”。“完成一轮算力训练,投入至少是千万元级别;一年要训练三到五轮,成本就更高,这也是一般企业负担不起的。”史吉东提到。调研也显示,一些前期计划投资我省的大模型项目,也有因高端算力采购困难、供应支撑不足而暂停的。
山东近日印发《山东省算力基础设施高质量发展行动方案》,将统筹全省超级算力、智能算力和通用算力资源,夯实大模型应用“算力支撑”。“园区目前也在整合大型运营商强化算网一体化建设以及‘人工智能岛’为代表的公共基础平台建设。”齐鲁软件园发展中心产业规划部与外联部副部长齐心认为,目前迫切需要成立数据联盟,探索更科学合理的研发途径。
强化产业多方协同合作
在孙志强看来,未来区域数字经济发展竞争力的对抗,很可能会是一种模型对抗:“产业协同、生态建设……这些都需要多方政策支持、工作统筹,才能有效提速。大模型落地并非一锤子买卖,持续微调优化也需要建立算力、数据、垂直应用等多方在内的智能联合体。”
位于上海徐汇西岸的模速空间创业园区,分布有上海人工智能实验室、期智研究院、商汤科技、阿里巴巴、腾讯等知名科研机构和科技企业。这里流行一句话——“上下楼就是上下游”:一栋楼里聚集着大模型底层技术、应用研发、场景设计、算力支持、产品营销等产业链上不同的企业,企业服务对象就在一栋楼里,到隔壁办公室问一问,就能了解到最新动态。
“山东发展大模型产业也需要打造这样的孵化器,强化集聚效应。”今年3月中国产业大模型研究院在济南成立,院长石玉峰透露,目前以青岛为主,相关孵化计划已启动。大模型需要既懂数学理论又懂工程技术的人才,我省大模型企业普遍反映,很难招聘到既熟悉行业机理又精通数字技术的大模型开发人才,山东省计算中心(国家超级计算济南中心)正联合高校、协会等开展相关培训,进一步完善创新创业保障。
据了解,依托山东国家应用数学中心等国家级平台,山东正在探索“产业大模型研究院(算法研究、人才培养)+重点行业‘产业大脑’(数据汇集)+黄河工业算力联盟(算力支撑)+数字技术或行业龙头企业(成果转化)”产业发展路径。“借此,大模型产业将加快拥抱千行百业,更高水平赋能新型工业化。”孙志强表示。
(记者 付玉婷)