首个中文表格预训练模型发布!达摩院AliceMind开源体系再添新成员
近日有关于隋唐英雄117的话题受到了许多网友们的关注,大多数网友都想要知道隋唐英雄117问题的具体情况,那么关于隋唐英雄117的相关信息,小编也是在网上收集并整理的一些相关的信息,接下来就由小编来给大家分享下小编所收集到的与隋唐英雄117问题相关的信息吧。
以上就是关于隋唐英雄117这个话题的相关信息了,希望小编分享给大家的这些新闻大家能够感兴趣哦。
12月2日,达摩院深度语言模型体系AliceMind发布中文社区首个表格预训练模型SDCUP,该模型在全球权威表格数据集WikiSQL、SQuALL上取得了业界最优效果,且模型和训练代码均已对外开源。
(https://github.com/alibaba/AliceMind)
表格是应用普遍的结构化数据,也是智能对话系统和搜索引擎的重要答案来源。但传统表格查询需技术人员撰写专业查询语句,阻碍了表格查询的大规模应用。新兴的表格问答技术,可将自然语言转换为查询语句,使用户能通过简单问句直接与表格数据库交互,具有广泛应用前景。
不过,由于表格内容复杂多样、涉及各行业专业知识,表格问答任务一直是自然语言处理领域的难题。此前,谷歌、微软、亚马逊等海外公司开展了相关探索,但在中文场景,该方向处于空白。
本次,达摩院对话智能团队提出了首个中文表格预训练模型SDCUP,其基于“模式依存”方法,通过模型直接预测自然语言与表格结构内容的关键词映射,提升了表格问答的准确率。具体而言,即参考语义依存分析方法对Schema Dependency任务建模,使用全连接网络获取每个节点作为父亲节点和作为孩子节点的语义表示,然后使用双仿射网络预测每个边存在的概率和该边关系类型的概率。同时,团队使用了模仿人类的“课程学习”方法减少数据噪声。
SDCUP生成SQL示例
在耶鲁大学发布的业界最大规模的英文文本-表格数据集WikiSQL,以及微软构建的英文文本-表格高难度预测任务SQuALL数据集上,SDCUP模型均取得业界最优效果。在达摩院构建的表格问答中文数据集TaBLUE上,SDCUP比同参数规模BERT模型效果提升约3个百分点。
SDCUP在WikiSQL数据集上取得业界最优效果
SDCUP在SQuALL数据集上取得业界最优效果
达摩院资深算法专家李永彬介绍,SDCUP模型是达摩院表格对话技术系列研发的一部分,后续将持续对外开源。其相关技术先后在四大国际公开数据集WikiSQL、Spider、SParC、CoSQL上取得第一。
据了解,该技术完成了产品化,已通过阿里云智能客服为政务、金融、零售等行业客户提供表格问答和数据库自然交互服务。
萌萌小腐女 http://www.cityruyi.com/lm-3/lm-3/9014.html- 标签:隋唐英雄117
- 编辑:马拉文
- 相关文章
-
首个中文表格预训练模型发布!达摩院AliceMind开源体系再添新成员
12月2日,达摩院深度语言模型体系AliceMind发布中文社区首个表格预训练模型SDCUP,该模型在全球权威表格数据集WikiSQL、SQuA…
-
男寝沸腾 深夜裸奔 EDG夺冠后 你的青春又回来了吗?
昨天对于电子竞技爱好者们绝对是一个不眠之夜,如果你并不是一名电竞资深的爱好者,你也许会被对面男生寝室震耳欲聋的“EDG…
- 功夫游戏师父年龄机制详解!师父战斗系统深入介绍
- 天命奇御2发售倒计时仅剩1天!天命奇御2人物海报预告
- 《三体》讲述中国气质科幻故事 动画剧本开始收尾
- 《仙剑奇侠传7》首个DLC为剧情向《仙剑奇侠传7》暂不考虑NS
- 1780元!Hottoys《蜘蛛侠:英雄无归》小蜘蛛1/6人偶