咨询QQ:
      杂志订阅

      编辑

      网管

      培训班

      市场部

      发行部

电话服务:
 010-82024984
 010-82024981
欢迎, 客人   会员中心   帮助   合订本   发布信息
设为首页 | 收藏本页
迎接AI大模型新时代到来
  • 当今,人类社会正加速迈向智能世界,数据也在爆炸式增长,AI技术发展一路突飞猛进。以强大算力为基础的各种模型和算法不断涌现,应用场景更加日益丰富,AI大模型成为人工智能迈向通用智能的里程碑技术。
  • 当今,人类社会正加速迈向智能世界,数据也在爆炸式增长,AI技术发展一路突飞猛进。以强大算力为基础的各种模型和算法不断涌现,应用场景更加日益丰富,AI大模型成为人工智能迈向通用智能的里程碑技术。
      
      AI大模型的落地应用使得AI的三要素由“数据、算法、算力”演变为“场景、产品、算力”。基于数据的互联网时代和基于算力的云计算时代之后,我们将进入基于大模型的AI时代。
      
      AI大模型是“大数据+大算力+强算法”结合的产物,凝聚了大数据内在精华的“隐式知识库”。包含了“预训练”和“大模型”两层含义,即模型在大规模数据集上完成了预训练后仅需要少量数据的微调,就能直接支撑各类应用。
      
      AI大模型发展历经的三个时段,分别是萌芽期(1950-2005):以CNN为代表的传统神经网络模型阶段。沉淀期(2006-2019):以Transformer为代表的全新神经网络模型阶段。爆发期(2020-至今):以GPT为代表的预训练大模型阶段。AI大模型先后经历了预训练模型、大规模预训练模型、超大规模预训练模型三个阶段,每年参数规模至少提升10倍,参数量从亿级到百万亿级的突破。目前千亿级参数规模的大模型成为主流。
      
      AI大模型的发展形态,从应用领域上看:大模型可分为通用大模型和行业大模型两种。ChatGPT、华为的盘古都是通用大模型。行业大模型则是利用行业知识对大模型进行微调,让AI完成“专业教育”,以满足在能源、金融、制造、传媒等不同领域的需求。
      
      从模态支持上看,AI大模型可分为自然语言处理大模型、CV大模型、科学计算大模型等。从技术架构上看,Transformer架构是当前大模型领域主流的算法架构基础,由此形成了GPT和BERT两条主要的技术路线,其中BERT最有名的落地项目是谷歌的AlphaGo。GPT逐渐成为大模型的主流路线。当前几乎所有参数规模超过千亿的大型语言模型都采取GPT模式,如百度文心一言,阿里发布的通义千问等。
      
      AI大模型国内外发展概况。国外巨头的竞争已经白热化。OpenAI已成为引领大模型发展的标杆企业。继多模态大模型GPT-4发布后,预计今年四季度OpenAI将发布更为高级的ChatGPT-5版本。微软已在3月下旬推出CopilotOffice。5月24日,微软宣布Win11接入GPT-4。5月10日,谷歌推出新一代大模型PaLM2,已有超过25个AI产品和功能全线接入PaLM2。Meta则发布大模型LLaMA,加入竞赛。亚马逊与人工智能初创公司Hugging Face合作开发ChatGPT竞品——BLOOM。
      
      国内,产投研各方均已加快布局步伐。百度发布大模型文心一言,阿里发布首个超大规模语言模型通义千问,腾讯混元AI大模型团队推出了万亿级别中文NLP预训练模型HunYuan-NLP-1T。华为发布的鹏城盘古大模型是业界首个千亿级生成和理解中文NLP大模型。澜舟科技发布其语言生成模型——孟子MChat可控大模型,西湖心辰也推出了心辰Chat大模型。复旦大学推出国内首个类ChatGPT大模型MOSS,清华大学知识工程实验室与其技术成果转化公司智谱AI发布ChatGLM,中科院自动化所推出多模态大模型紫东太初,DEA研究院CCNL推出开源通用大模型“姜子牙”。
      
      总之,AI大模型将逐渐发展成为新型基础设施,为上层行业应用开发和开源生态提供低成本技术支撑,形成以大模型为中心的新产品生态。
      
      编辑:Harris
      
      

  •