在KDnuggets Poll中Gregory Piatetsky做了一个关于数据科学应用领域的调查。调查的具体内容是让读者悬着数据分析、数据挖掘、数据科学在2016年都应用在哪些领域。(KDnuggets Poll asked readers to select Industries / Fields where you applied Analytics, Data Mining, Data Science in 2016? )
笔者对其调查的数据进行了从新整理,如下:
Industries / Fields | 行业 / 领域名 | 2016占比 | 2016排名 | 2015占比 | 2015排名 | 2014占比 | 2014排名 |
CRM/Consumer analytics (90) | 客户关系管理 | 16.30% | 1 | 18.60% | 1 | 22.20% | 1 |
Finance (83) | 金融 | 15.00% | 2 | 15.40% | 2 | 10.90% | 8 |
Banking (74) | 银行 | 13.40% | 3 | 14.30% | 3 | 16.70% | 2 |
Health care (66) | 卫生保健 | 12.00% | 6 | 13.40% | 4 | 16.30% | 3 |
Science (66) | 科学研究 | 12.00% | 5 | 11.70% | 5 | 13.60% | 4 |
Advertising (66) | 广告业 | 12.00% | 4 | 8.90% | 11 | 10.40% | 9 |
Fraud Detection (61) | 欺诈检测 | 11.10% | 7 | 10.00% | 8 | 13.60% | 5 |
Retail (57) | 零售业 | 10.30% | 8 | 9.10% | 10 | 13.60% | 6 |
Insurance (51) | 保险业 | 9.20% | 9 | 7.40% | 15 | 8.60% | 15 |
E-commerce (49) | 电子商务 | 8.90% | 10 | 10.30% | 6 | 9.50% | 10 |
Telecom / Cable (46) | 电信业 | 8.30% | 11 | 7.70% | 14 | 9.00% | 12 |
Social Media / Social Networks (46) | 社会媒体 | 8.30% | 12 | 10.30% | 7 | 8.60% | 14 |
Software (40) | 软件业 | 7.20% | 13 | 6.00% | 21 | 7.20% | 18 |
IT / Network Infrastructure (40) | IT行业/网络基础设施 | 7.20% | 14 | 6.60% | 19 | 0.00% | 35 |
Oil / Gas / Energy (39) | 能源业 | 7.10% | 15 | 8.90% | 12 | 9.50% | 11 |
Education (39) | 教育业 | 7.10% | 16 | 10.00% | 9 | 7.70% | 17 |
Credit Scoring (38) | 信用评估 | 6.90% | 17 | 7.10% | 16 | 8.10% | 16 |
Medical/ Pharma (36) | 医药业 | 6.50% | 19 | 6.00% | 22 | 7.20% | 19 |
Supply Chain (36) | 供应链 | 6.50% | 18 | 0.00% | 38 | 0.00% | 38 |
Other (35) | 其他 | 6.30% | 20 | 8.90% | 13 | 13.60% | 7 |
Investment / Stocks (34) | 投资股票 | 6.20% | 21 | 4.30% | 26 | 5.00% | 26 |
Biotech/Genomics (32) | 生物技术 | 5.80% | 22 | 4.90% | 25 | 6.80% | 21 |
Manufacturing (31) | 制造业 | 5.60% | 23 | 6.90% | 18 | 9.00% | 13 |
Government/Military (31) | 政府 | 5.60% | 24 | 7.10% | 17 | 6.30% | 22 |
Search / Web content mining (30) | 调查/互联网挖掘 | 5.40% | 25 | 6.00% | 23 | 6.30% | 23 |
Automotive/Self-Driving Cars (25) | 自动驾驶汽车 | 4.50% | 26 | 4.30% | 27 | 5.90% | 25 |
Direct Marketing/ Fundraising (24) | 直销/募资 | 4.30% | 27 | 5.10% | 24 | 7.20% | 20 |
Mining (23) | 数据挖掘 | 4.20% | 28 | 3.70% | 29 | 0.00% | 36 |
Travel / Hospitality (22) | 旅游业 | 4.00% | 29 | 2.60% | 32 | 3.20% | 27 |
Entertainment/ Music/ TV/Movies (22) | 娱乐业 | 4.00% | 30 | 3.10% | 30 | 1.80% | 31 |
HR/workforce analytics (20) | 人力资源管理 | 3.60% | 31 | 6.30% | 20 | 5.90% | 24 |
Mobile apps (18) | 移动应用 | 3.30% | 32 | 1.40% | 36 | 2.30% | 29 |
Agriculture (18) | 农业 | 3.30% | 33 | 2.90% | 31 | 0.00% | 37 |
Games (16) | 游戏 | 2.90% | 34 | 4.00% | 28 | 1.80% | 30 |
Security / Anti-terrorism (15) | 安全反恐 | 2.70% | 35 | 2.30% | 33 | 2.30% | 28 |
Social Good/Non-profit (11) | 社会公益 | 2.00% | 36 | 2.30% | 34 | 1.40% | 34 |
Social Policy/Survey analysis (10) | 社会政策 | 1.80% | 37 | 1.70% | 35 | 1.80% | 32 |
Junk email / Anti-spam (6) | 反垃圾邮件 | 1.10% | 38 | 0.30% | 37 | 1.80% | 33 |
如上图所示,2016年数据科学应用领域的前十名分别是”客户关系管理”“金融”“银行”“卫生保健”“科学研究”“广告业”“欺诈检测”“零售业”“保险业”“电子商务”。
而在这些领域中”客户关系管理”“银行业”“卫生保健业”“能源业”等行业领域从2014年到2016年每年的占比是逐年下降的趋势。而”客户关系管理”虽然每天的占比都在下降,但是仍然保持在第一位。
“广告业”“欺诈检测”“零售业”“保险业”“电信业”则在2015年占比下降之后有了小幅度的提升。
如上图所示,近三年各个领域的总占比从高到低排序依次是:”客户关系管理”“银行”“卫生保健”“金融”“科学研究”“欺诈检测”“零售业”“广告业”“电子商务”“社会媒体”
以上数据只是各个领域的占比,并不是总数。因为2016年参加投票的读者总数比2015年增加了60%,所以说虽然有些领域的占比是下降的,但是领域的应用总数是增加的。
原文链接:http://www.kdnuggets.com/2016/12/poll-analytics-data-mining-data-science-applied-2016.html