AI大模型:中国工业大模型行业发展研究报告(2024年)
工业大模型伴随着大模型技术的发展,逐渐渗透至工业,处于萌芽阶段。
就大模型的本质而言,是由一系列参数化的数学函数组成的计算系统,且是一个概率模型,其工作机 制是基于概率和统计推动进行的,而非真正的理解和逻辑推理,因此,当前大模型具有 不可解释性和幻觉不可消除等主要特征。就大模型落地工业的情况而言,工业互联网、 等工作已经让部分工业企业遍历了数据采集-数据存储-数据处理-数据分析-数据资产沉淀 -数据应用的过程,部分场景已经准备好了向基础大模型投喂的“数据原料”,当经过简 单数据处理、微调、适配后,可以解决部分垂直细分场景问题,具有落地可行性。就工 业大模型的发展进度而言,工业大模型与工业互联网一样,都是要挖掘数据资产的价值, 而数据准备的阶段性工作在工业互联网时期大部分已经准备好,故我们预计工业大模型 的进程在技术不受限的前提下,可能会快于工业互联网。当然,工业大模型是以大模型 技术为驱动,其进程快慢很大程度受限于大模型本身能力的进化。
工业大模型玩家与工业互联网平台玩家重合度高,其成长路径目前也表现出高度相似的 特征,但目前市场产品、服务、落地场景都处于探索阶段,大家都在同一起跑线。大模型落地工业的探索中,还处于非常早期的阶段,供需双方都在尝试,当然,也有很 多问题值得探讨与思考。
幻影视界今天分享的是人工智能AI行业研究报告:《中国工业大模型行业发展研究报告:靡不有初,鲜克有终》。 大模型是什么?大模型的能力如何获取?
大模型是从海量数据中学习并记住泛知识后,在域内数据+提示数据集的 修正下,具备在某类具有相对更准确能力的计算系统,其本质是概率模型.
据Andrej Karpathy所言,大模型本质由巨大的参数文件+运行参数的代码文件两大核心组件构成。其中:1)参数文件是通过大量 数据训练获得的,代表从数据中提取的有用信息和模式(可称为“知识”),其参数量与对知识的记忆能力,与数据量、数据按照 不同说明进行曝光的次数有关。2)代码文件有点类似“大脑”,主要是指导参数文件进行推理和产出,其中,可根据域内数据、提 示数据集等进行调参,不断提升模型的准确性。
因此,总结来看,大模型能力获得主要有四步:1)针对大量数据进行预训练,让大 模型学习并记住知识;2)明确大模型能力侧重点,即给一定高质量、针对性强的域内数据集微调,让大模型在某些能力更加突出;3)通过标注人员对大模型给出的答案进行排序,给予大模型正向反馈;4)强化学习。以上,也说明大模型的能力不是只要参数量 足够大就具备涌现能力,是需要逐项优化才逐步具备某些能力的。
需要注意的是,大模型本质是一个概率模型,可从2个角度理解:1)具有不可解释性:虽然可以调参,但是并不知道这些参数在做什么,如何协同工作,表示的是什么意思;2)幻觉不可消除:模 型的工作机制是基于概率和统计推断进行的,而非真正的理解和逻辑推理,且与预训练的数据量、曝光次数、微调数据量及数据的 选择、奖励函数偏好等息息相关。 大模型及其相关概念的关系是什么?
AI是泛技术的统称,机器学习、深度学习是各类算法,大模型、生成式AI 等是对各类算法组合运用的能力的体现,而ChatGPT则是算法应用的具体 产品。通常说的大模型是已经预训练完成的具有一定泛化能力的基础模型
大模型在工业应用是否具有可行性?
数据积累、数据资产沉淀等基础以具备,大模型落地工业领域成为可能 大模型的本质是由一系列参数化的数学函数组成的计算系统,是人工智能系统对知识的一种表示和处理方式,本身就具备“数据喂 养—认知构建”的“学习”能力。因此,在已经学习海量通用数据、具备一定泛化能力的基础模型的基础上,向其“喂养”特定行 业/场景的数据及规则,经过定制开发、调整、训练、调优等操作后,该基础模型将获得特定行业/场景能力的“认知能力”,在一定 程度上可称为特定行业/场景大模型。就工业领域而言,工业互联网、工业智能制造等工作,已经让部分工业领域企业遍历了数据采集-数据存储-数据处理-数据分析-数据 资产沉淀-数据应用的过程,部分场景已经准备好了向基础大模型投喂的“数据原料”,当经过数据处理、适配、微调,甚至是训练 后,逐步演进为工业大模型,可以解决部分垂直细分场景问题,大模型落地工业成为可能。 工业大模型的产业价值流转情况如何?
上游服务方整体集中,且头部效应明显;中游市场参与玩家众,虽服务 能力各有侧重,但结合行业know how/行业数据积累进行基础大模型微 调、RAG是主要服务思路;下游市场需求广阔,但尚处于探索阶段 工业大模型玩家将如何挣钱?
定制化的综合解决方案是当前核心收费模式,更多收费模式可能需探索大模型落地于工业领域尚处于萌芽期,其产品形态、服务内容都还在逐步摸索中,其变现方式虽有一些相近服务或行业可以参考, 整体不确定性非常高,但一切尝试也都有意义。 工业大模型供给方常规的做法是:与基础大模型厂商合作-测试大模型特点、性能-结合自身产品/能力进行微调-根据客户需求进行客 制化服务。 工业大模型玩家的成长路径为何?
目前尚处于产品雏形期,探讨成长路径为时过早,但很大可能会借鉴工 业互联网平台产品-项目-平台的成长路径 大模型落地工业的产品服务架构是怎样的? 大模型落地工业的应用思路有哪些?
4种应用形式各有千秋,其中RAG、微调是目前较为普遍的用法 大模型落地工业的常见架构有哪些?
大模型落地工业时有5种常见架构,没有最好,只有相对最优 目前大模型落地工业主要有4种应用思路,每一种应用思路都可能有不同的架构去实现相应的结果或目的。目前,大模型落地工业时 常见的架构有5种,不同架构各有特色。对于供给方或者需求方而言,不同架构没有绝对的优势,更多是根据不同需求,结合效果、 性价比等考量后,做出的架构选择。模型及服务是大模型落地工业的核心,也是大部分工业大模型厂商对外 赋能的基础. 幻影视界整理分享报告原文节选如下:
本文仅供参考,不代表我们的任何投资建议。幻影视界整理分享的资料仅推荐阅读,用户获取的资料仅供个人学习,如需使用请参阅报告原文。