福利 | 《人工智能之数据挖掘》报告发布:北京相关学者流动人次最高(附下载)...

来源:学术头条

本文约1600字,建议阅读5分钟

本文介绍了数据挖掘的最近研究进展,并展望了数据挖掘的未来发展趋势。

文末有数据派THU福利哦


近日,由清华大学人工智能研究院、北京智源人工智能研究院、清华 — 中国工程院知识智能联合研究中心共同编写的《人工智能之数据挖掘》报告正式发布。报告针对数据挖掘的情况进行了深度剖析,从数据挖掘的概念内涵、关键技术、人才研究、应用场景、发展趋势 5 个部分,介绍数据挖掘的最近研究进展,并展望了数据挖掘的未来发展趋势。

数据挖掘旨在从数据中挖掘知识,是一种跨学科的计算机科学分支,使用人工智能、机器学习、统计学和数据库等交叉学科领域方法在大规模、不完全、有噪声、模糊随机的数据集中自动搜索隐藏于其中的有着特殊关系性的数据和信息,并将其转化为计算机可处理的结构化表示,是知识发现的一个关键步骤。


报告分别对数据挖掘十大经典算法、统计数据分析方法、科技情报挖掘技术、社交网络与图数据挖掘技术、自然语言数据挖掘技术、多媒体数据挖掘技术、大规模数据挖掘技术、数据隐私保护和安全等方面进行了详细介绍和深入分析,并解读了 2013 年 - 2020 年 SIGKDD 会议收录的代表性论文。报告旨在为读者了解数据挖掘领域基础研究和应用研究等方面的代表性成果、研究动向和进展提供信息窗口。报告还介绍了数据挖掘技术在零售业、旅游业、物流业、医学界、金融业和电信业领域的应用。


报告依托清华大学自主研发的 AMiner 平台,分析了数据挖掘领域 21,018 位研究学者,并以他们发表的论文作为底层数据,从学者分布、学术水平、国际合作、学者流动等维度,对比分析了国内外机构、学者在该领域的发展状况,并利用 AMiner 平台的学者画像功能,展示了国内外代表性学者的详细信息,最后给出了相应的对策建议。下面选取具有代表性的分析维度进行说明。

技术研究发展趋势

数据挖掘和社交网络的研究热度居高不下,近五年来大数据、异常检测和时间序列挖掘的研究热度呈现明显的上升趋势。另外,聚类和分类的研究热度一直维持在较高水平,但在近五年内呈现出明显的下滑趋势。

图 2丨数据挖掘领域的技术研究发展趋势

 

学者分布

AMiner 平台数据显示,世界范围内数据挖掘领域高水平学者主要集中在以美国为首的北美洲、以英国、意大利为首的欧洲,和以中国为首的亚洲。

图 3丨数据挖掘领域 h-index 排名前 1000 学者的全球分布地图

中国数据挖掘领域高水平学者主要分布在京津冀地区、长江三角洲地区、广东省、香港特别行政区等中国东部发达地区。

图 4丨 数据挖掘领域 h-index 排名前 1000 学者的中国分布地图

学术水平

数据挖掘领域高水平论文总被引频次最高的国家是中国,其次是美国,但两者相差不大。中美两国在论文总被引频次、论文发表量、学者数量等指标上均远高于其他国家。


表 1 数据挖掘高水平论文总被引频次排名前 10 的国家

数据挖掘领域高水平论文总被引频次排名前 10 的全球机构中,中国仅清华大学上榜(排名第 5),其余 9 所机构均在美国。


表 2 数据挖掘高水平论文总被引频次排名前 10 的全球机构

国家合作

在数据挖掘领域合作高水平论文数量排名前 10 的国家中,大部分国家都倾向与中国(与其合作的国家数量为 6 个)、美国(与其合作的国家数量为 5 个)合作,其中中美两国合作最紧密。

图 5丨全球各国数据挖掘领域论文合作网络图


表 3 数据挖掘领域合作论文数量排名前 10 的国家列表

学者流动

2010 年 —2020 年间,美国数据挖掘领域学者流入和流出人次均位居全球首位,中国虽然位居第二,但约为美国一半。美国和澳大利亚在该领域学者流出人次大于流入人次,而中国、英国、印度、德国等国家相反。

图 6丨全球数据挖掘领域学者的流动情况


2010 年 —2020 年间,中国各省市中,北京市的数据挖掘学者流入和流出的人次明显高于其他地区。北京、上海和香港在该领域学者流入人次均高于流出人次,而南京、西安、武汉和杭州等地与此相反。


图 7丨中国数据挖掘领域学者的流动情况

学者画像

报告利用 AMiner 平台的 “学者画像” 功能,展示了数据挖掘领域国内外具有代表性的专家学者信息,包括基本信息、研究兴趣、学术指标、科研网络等。

图 8丨AMiner 平台数据挖掘领域学者画像示例

更多内容欢迎下载报告全文进行阅读。

报告全文下载地址:

https://static.aminer.cn/misc/pdf/DataMining.pdf

编辑:于腾凯

校对:王欣


数据派THU独家福利!

《Python数据分析全流程实操指南》主要围绕整个数据分析方法论的常规流程,介绍了Python常用的工具包,包括科学计算库Numpy、数据分析库Pandas、数据挖掘库Scikit-Learn,以及数据可视化库Matplotlib和Seaborn的基本知识,并从数据分析挖掘的实际业务应用出发,讲解了互联网、金融及零售等行业的真实案例,比如客户分群、产品精准营销、房价预测、特征降维等,深入浅出、循序渐进地介绍了Python数据分析的全过程。

点点为数据派THU的粉丝们争取了2本赠书福利!欢迎小伙伴儿在下方留言区说出想要获得赠书的理由,我们将为点赞数最高(截止到2020年12月19日中午12点)的2位读者免费送上此书~小编会联系你们哦!

点击“阅读原文”查看报告全文

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值