首席技术官王海峰近日在由深度学习技术及应用国家工程研究中心主办的WAVE SUMMIT深度学习开发者大会上表示。
学术界普遍认为,深度学习具有很强的通用性,并具备标准化、自动化和模块化的工业大生产特征,将推动进入工业大生产阶段。2019年以来,深度学习技术和应用的发展充分验证了这一观点——深度学习技术的通用性越来越强,深度学习平台的标准化、自动化和模块化特征越来越显著。而预训练大模型的兴起,则使应用的深度和广度进一步拓展。这意味着,人工智能已进入工业大生产阶段。
王海峰表示,人工智能具有多种典型能力,理解、生成、逻辑、记忆是其中的核心基础能力,这四项能力越强,越接近通用人工智能,开云电竞 开云而大语言模型具备了这四项能力。
具体而言,人工智能的典型能力如创作、编程、解题、规划等都依赖于理解、生成、逻辑、记忆等核心基础能力,依赖程度有所不同。以解题为例,从读懂题目、解答题目到最后写出答案,需要理解、记忆、逻辑及生成能力的综合运用。
如何获得这些能力?王海峰介绍,以文心一言为例,首先从数万亿数据和数千亿知识中融合学习得到预训练大模型,在此基础上采用有监督精调、人类反馈的强化学习和提示等技术,并具备知识增强、检索增强和对话增强等技术优势。进一步地,通过多种策略优化数据源及数据分布、基础模型长文建模、多类型多阶段有监督精调、多任务自适应有监督精调、多层次多粒度奖励模型等技术创新,全面提升基础通用能力。
当下,以大语言模型为代表的人工智能正在深入千行百业,加速产业升级和经济增长。“在此进程中,技术创新和应用落地形成良性循环,开云电竞 开云理解、生成、逻辑、记忆等能力持续提升,产业应用的广度和深度持续拓展,大语言模型为通用人工智能带来曙光。”王海峰说。