![]() |
![]() |
人工智能技术演进走向新范式:单任务智能到多任务智能 |
||
2024/12/12 16:51:24 | ![]() |
|
人工智能浪潮席卷,正以前所未有的速度、广度和深度改 变生产生活方式。世界主要纷纷将推进人工智能技术创新与应 用作为战略的重要方向,我国G度重视人工智能在培育新质生 产力、塑造新动能方面的重要作用。当前,人工智能正处于迈向通用 智能的初始阶段,并成为推动经济社会持续发展的关键动力。
以Transformer架构为基础的大模型不断取得新突破,在大数据、 大算力加持下,逐渐实现从单任务智能到可扩展、多任务智能的跨 越。这一关键突破,标志着人工智能技术发展走向新范式。以大模型为代表的人工智能技术展现出了类人智能的“涌现”能力,呈现规模可扩展、多任务适应及能力可塑三大特征。 一是规模可扩展。 模型的规模可扩展性不仅体现在参数的扩大,更依赖G质量数据集 的供给以及大规模算力集群能力的增强。当前在模型参数保持不变 的情况下,提G数据质量、扩大数据集规模或提升算力规模水平,都能够显著增强模型的复杂性和处理能力。 二是多任务适应。大模型支持多任务多模态能力持续增强,可执行任务已经从文本对话拓 展到多模态理解、多模态生成等场景。 三是能力可塑。通用大模型 在训练阶段通过结合增量预训练、有监督微调、知识图谱等方法, 实现将专业数据和知识注入模型中,提升大模型在专业L域的应用 能力;在推理阶段,通过引入检索增强生成、提示词工程和智能体 等技术,将更丰富的上下文信息和专业知识引入模型推理过程,解 决更复杂的推理任务,优化模型表现。 具体从大模型算法演进态势看,深挖现有体系架构潜力,以实 现理解推理能力和训练效率倍增仍是当前发展主线。模型研发主体 纷纷围绕算法理论融合(如 Transformer 架构与其他路线结合)和模 型改造(如扩大上下文窗口、思维链复杂推理、优化注意力模块、 网络架构稀疏化、多模态特征对齐与统一理解等)展开创新升J, 从而提G模型性能表现。近期 OpenAI o1 模型通过模仿人脑思考的 思维过程,显著提升数学、物理、编程等复杂任务的性能水平。与 此同时,非 Transformer 模型的底层算法也在不断创新。例如,基于 图神经网络的 GraphCast、GNoME 在气象和材料L域已取得重大突 破,基于物理约束的 PINN 网络、基于算子学习的 DeepONet 和基于 傅里叶变换的 FNO 网络已成为求解偏微分方程(PDEs)的重要手段。
|
||
上一篇 下一篇 |
返回顶部 ∧ |
技术支持 |
关于创泽 |
隐私条款 |
|
版权所有 @ 创泽智能机器人集团股份有限公司 运营中心 / 北京市·清华科技园九号楼5层 生产中心 / 山东省日照市开发区太原路71 |