腾讯“混元”AI大模型登顶CLUE三大榜单

未知 2022-05-25 20:01

腾讯“混元”AI大模型登顶CLUE三大榜单

5月24日,腾讯“混元”AI大模型在CLUE(中文言语了解评测调集)总排行榜、阅览了解、大规模常识图谱三个榜单同时登顶,一举打破三项纪录。

据了解,CLUE总榜由分类使命和阅览了解使命构成。腾讯“混元”AI大模型在一个月内先后完成分类使命、阅览了解双佳绩,最终以 84.730的成绩取得总榜第一。

作为中文最具威望的自然言语了解榜单之一,CLUE共开设了包含文本类似度、分类、上下文推理、阅览了解在内的9项子使命,旨在推动NLP(自然言语处理预)练习模型技能的不断进步和打破。

NLP(自然言语处理)技能是人工智能范畴的一个核心研讨方向,其目的是使得计算机具有人类的听、说、读、写等能力,并使用常识和常识进行推理和决策。现在,越来越多的科技企业和研制机构投入到该范畴的研讨当中,在CLUE等业界榜单的竞争也十分激烈。

在预练习阶段,除惯例揭露数据集之外,“混元”大模型还学习了商业范畴特有的文本数据集。因此,相较于业界其他AI大模型,“混元”能够更好地了解各种长度文本信息,应对查找、广告、新闻、问答等多样化的场景使命,在阅览了解、常识图谱相关的下流使命中也愈加具有优势。

除性能提高之外,“混元”大模型经过凭借数据及模型课程学习、多短句兼并掩码、改进PowerSGD(优化通讯算法)等办法,有用压缩低带宽环境下GPU节点练习的通讯数据量和通讯耗时,完成练习效率的大幅提高。

现在,腾讯“混元”AI大模型研制团队现已将改进的PowerSGD办法贡献给PyTorch开源社区,将在PyTorch下个版本中正式上线。

得益于“混元”AI大模型在自然言语了解、跨模态检索范畴强壮的技能能力,自今年4月以来,该模型已成功斩获MSR-VTT、MSVD、CLUE等各大威望AI榜单榜首,这意味着,腾讯在人工智能范畴的技能研制已取得打破性发展。

现在,“混元”NLP大模型现已使用于腾讯内部多个业务,并在腾讯广告的数据发掘使命中带来超越5%的目标提高,提高广告推荐的精准度,优化用户体会。未来,腾讯混元AI大模型研制团队将依据详细场景需求持续推动大模型的研讨和优化,加速AI技能在各个产业的使用和落地。

 

标签