迎接AI大模型新时代到来 - 刊首语 - 文章资料

您的位置: 首页»文章资料»刊首语»迎接AI大模型新时代到来

迎接AI大模型新时代到来

2023/10/8 8:18:21 作者：何春华来源：《数据中心建设+》杂志
分享:QQ空间新浪微博人人网腾讯微博网易微博

当今，人类社会正加速迈向智能世界，数据也在爆炸式增长，AI技术发展一路突飞猛进。以强大算力为基础的各种模型和算法不断涌现，应用场景更加日益丰富，AI大模型成为人工智能迈向通用智能的里程碑技术。

当今，人类社会正加速迈向智能世界，数据也在爆炸式增长，AI技术发展一路突飞猛进。以强大算力为基础的各种模型和算法不断涌现，应用场景更加日益丰富，AI大模型成为人工智能迈向通用智能的里程碑技术。
　　
　　AI大模型的落地应用使得AI的三要素由“数据、算法、算力”演变为“场景、产品、算力”。基于数据的互联网时代和基于算力的云计算时代之后，我们将进入基于大模型的AI时代。
　　
　　AI大模型是“大数据+大算力+强算法”结合的产物，凝聚了大数据内在精华的“隐式知识库”。包含了“预训练”和“大模型”两层含义，即模型在大规模数据集上完成了预训练后仅需要少量数据的微调，就能直接支撑各类应用。
　　
　　AI大模型发展历经的三个时段，分别是萌芽期（1950-2005）：以CNN为代表的传统神经网络模型阶段。沉淀期（2006-2019）：以Transformer为代表的全新神经网络模型阶段。爆发期（2020-至今）：以GPT为代表的预训练大模型阶段。AI大模型先后经历了预训练模型、大规模预训练模型、超大规模预训练模型三个阶段，每年参数规模至少提升10倍，参数量从亿级到百万亿级的突破。目前千亿级参数规模的大模型成为主流。
　　
　　AI大模型的发展形态，从应用领域上看：大模型可分为通用大模型和行业大模型两种。ChatGPT、华为的盘古都是通用大模型。行业大模型则是利用行业知识对大模型进行微调，让AI完成“专业教育”，以满足在能源、金融、制造、传媒等不同领域的需求。
　　
　　从模态支持上看，AI大模型可分为自然语言处理大模型、CV大模型、科学计算大模型等。从技术架构上看，Transformer架构是当前大模型领域主流的算法架构基础，由此形成了GPT和BERT两条主要的技术路线，其中BERT最有名的落地项目是谷歌的AlphaGo。GPT逐渐成为大模型的主流路线。当前几乎所有参数规模超过千亿的大型语言模型都采取GPT模式，如百度文心一言，阿里发布的通义千问等。
　　
　　AI大模型国内外发展概况。国外巨头的竞争已经白热化。OpenAI已成为引领大模型发展的标杆企业。继多模态大模型GPT-4发布后，预计今年四季度OpenAI将发布更为高级的ChatGPT-5版本。微软已在3月下旬推出CopilotOffice。5月24日，微软宣布Win11接入GPT-4。5月10日，谷歌推出新一代大模型PaLM2，已有超过25个AI产品和功能全线接入PaLM2。Meta则发布大模型LLaMA，加入竞赛。亚马逊与人工智能初创公司Hugging Face合作开发ChatGPT竞品——BLOOM。
　　
　　国内，产投研各方均已加快布局步伐。百度发布大模型文心一言，阿里发布首个超大规模语言模型通义千问，腾讯混元AI大模型团队推出了万亿级别中文NLP预训练模型HunYuan-NLP-1T。华为发布的鹏城盘古大模型是业界首个千亿级生成和理解中文NLP大模型。澜舟科技发布其语言生成模型——孟子MChat可控大模型，西湖心辰也推出了心辰Chat大模型。复旦大学推出国内首个类ChatGPT大模型MOSS，清华大学知识工程实验室与其技术成果转化公司智谱AI发布ChatGLM，中科院自动化所推出多模态大模型紫东太初，DEA研究院CCNL推出开源通用大模型“姜子牙”。
　　
　　总之，AI大模型将逐渐发展成为新型基础设施，为上层行业应用开发和开源生态提供低成本技术支撑，形成以大模型为中心的新产品生态。
　　
　　编辑：Harris
　　
　　

最新文章

刊首语更多>>

资源下载更多>>


咨询QQ: 杂志订阅编辑网管培训班市场部发行部电话服务: 010-82024984 010-82024981