分析sql字段_百分点认知智能实验室出品:增强分析中的智能问答揭秘

本文介绍了百分点认知智能实验室提出的X-SQL技术,结合语义分析与深度学习解决NL2SQL商用问题。在增强分析中,智能问答功能通过X-SQL与依存句法树解析,提高了SQL生成的准确性,应对复杂查询需求。目前在实际测试中,该方案准确率达到90.45%,具备商用潜力。
摘要由CSDN通过智能技术生成

ab387978ef6ff1631971c9be3ab6f481.png

编者按

NL2SQL是语义分析的一个子领域,它是智能问答功能的核心部分,但目前还没有成熟的可商用的技术方案。为此,百分点认知智能实验室提出结合了语义分析与深度学习的技术方案,即 X-SQL 的思路解决了该商用问题。百分点还综合利用了自然语言处理、深度学习、X-SQL、依存句法,实现了自然语言预处理、NL2SQL、图表匹配等模块,形成了一整套增强分析技术方案。该方案在实际测试中达到90.45%的准确率,且在实际使用中达到了可以商用的效果。

增强分析是指以机器学习为基础的数据分析和BI功能,包含智能数据发现、增强数据准备、增强数据分析等模块。目前增强分析已经在BI中广泛使用,Gartner 认为,到2020年,增强分析将成为新用户购买BI产品、数据科学和机器学习平台,以及嵌入式分析的主要驱动力。

通过增强分析功能,能够极大地降低用户的数据分析门槛,使一个非专业人员也能够轻松完成数据预处理和数据分析的整个分析流程。

1增强分析中的智能问答

智能问答功能是增强分析中非常重要的一个子任务,其目的是让用户能够通过一句自然语言就能自动生成对应的图表。比如,提问“2015年各地区的销售额?”系统自动就会展示出如下的结果:

f2cee13a3f86ee8b7b25b5717e3a7e87.png

在学术界,这个任务叫做 NL2SQL,目前已经有很多研究。英语环境通常采用的是WikiSQL和 Spider,而中文目前还没有统一的数据集。在 WikiSQL 数据集上,Leaderboard 中的方法都是把这个任务转化为槽值填充,然后利用深度学习的方法训练多个不同的子模型对每个槽位进行填充,比如作为SOTA模型的X-SQL。

虽然在WikiSQL 数据集上,模型的效果已经超越了人类,但是在产品化的过程中, WikiSQL过于简单,比如它只支持1个查询目标,1个聚合函数和最多4个过滤条件,不支持分组。而在实际使用中,有多个查询目标以及包含分组字段的问题比比皆是,比如“各省份的人口”,“每年的人口”,所以只是采用 X-SQL 的方法无法满足工业的需要;Spider 数据集中不仅支持对分组进行提问ÿ

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值