中文最佳,哈工大讯飞联合发布全词覆盖中文BERT模型


近日,哈尔滨工业大学与航空学院联合实验室发布了基于全字覆盖的中文BERT预训练模型。该模型在多个中文数据集上达到了目前中文预训练模型的最佳水平,有些效果甚至超过了原有的BERT、ERNIE等中文预训练模型。

这一新的模型资源极大地促进了汉语自然语言处理的研究和发展,弥补了以往汉语自然语言处理研究模型的空缺。此前,ERNIE使用了更多的网络数据,如百度百科和Tieba。它模拟非正式文本(例如微博等)。)更好,而BERT-wwm使用中文维基百科(包括简化和传统)数据进行培训,因此它在建模正式文本方面有更多优势。与此同时,BERT-wwm还可以更好地处理传统中文数据,因为ERNIE的词汇几乎没有传统中文,这给了行业一个额外的选择。

哈尔滨工业大学迅飞联合实验室(HFL)是中国科技大学迅飞重点引进和布局的核心研发团队之一。2014年由中国科技大学迅飞人工智能研究所和哈尔滨工业大学社会计算与信息检索研究中心(HIT-SCIR)联合成立。

哈尔滨工业大学迅飞联合实验室成立以来,双方一直在深入合作,特别是在语言认知计算领域,取得了显着的成绩。该研究涉及前瞻性课题,如阅读理解、自动评分、仿人回答、人机对话、语音识别后处理和社会舆论计算。相应的研究成果已应用于司法和教育领域。近年来,哈尔滨工业大学迅飞联合实验室赢得了许多世界冠军,包括SQuAD、SQuAD 2.0、CGED、CoQA、QuAC等。

此次发布的基于全字覆盖的中文BERT不仅表明HKUST迅飞保持了行业自然语言处理技术的领先水平,还积极将最新技术应用到中文自然语言处理的研究中,与行业一起推动了中文自然语言处理的研发,为中文信息处理做出了更多贡献。

人工智能正在蓬勃发展。人工智能不仅要求“能够听和说”,还要求“能够理解和思考”。这一技术飞跃需要大量的科学研究支持。认知智能的关键技术,如深层语义理解、逻辑推理和决策、自主学习和进化,是当前研究的热点。语音合成技术、语音识别技术、手写识别技术、自然语言处理技术、语音评价技术、声纹识别技术,这些技术都展示了迅飞的超强实力。

科大迅飞始终以“不屈不挠的精神”为核心使命。“高空”,即高空技术,强调了技术对人工智能发展的重要性。香港电讯迅飞长期以来一直保持着对科学研究的高投资。根据2018年财务报告,公司2018年新增相关研发费用4.52亿元,相关研发费用总额达到12.63亿元,同比增长55.82%。对科学研究的投资相当大,所以它的技术能一直保持行业领先也就不足为奇了。

科大迅飞也是目前我国唯一以语音技术为产业化方向的“国家863计划成果产业化基地”、“国家规划布局中的重点软件企业”和“国家高技术产业化示范工程”。曾两次荣获“国家科技进步奖”和“信息产业重大技术发明奖”。科技部依托科技大学迅飞,明确建设了认知智能国家重点实验室,这是我国第一个处于人工智能高级阶段的认知智能领域国家级重点实验室。

HKUST迅飞以其领先的技术和对整个人工智能生态产业的全面控制,向人们展示了它的长远眼光。这是中国第一个以智能语音和人机交互为核心的人工智能开放平台。基于o

炸花生米时,多少油温最适合?注意“这1点”!花生香脆不黑糊