【Mark Schmidt课件】机器学习与数据挖掘——数据探索

本课件的主要内容包括:

  1. 数据挖掘:鸟瞰视图;

  2. 数据挖掘:一些典型的处理步骤

  3. 什么是数据?

  4. 数据类型

  5. 数据清理

  6. 特征聚合

  7. 特征选择

  8. 特征转换

  9. 探索性数据分析

  10. 分类汇总统计

  11. 连续汇总统计

  12. 距离与相似度

  13. 汇总统计的局限性

  14. 可视化

  15. 基本绘图

  16. 直方图

  17. 箱形图

  18. 散点图

  19. 散点图阵列

  20. 等值线绘图

  21. 树形图

  22. 统计地图

  23. 流图

  24. 视频与交互可视化

  25. 熵作为随机性的量度

  26. Hamming距离 vs. Jaccard系数

  27. 大数据集与并行/分布式计算

  28. 数据清理与杜克癌症丑闻

关于“杜克癌症丑闻”是美国杜克大学的医生恶意篡改实验数据导致的学术界造假丑闻,从2006年持续到2012年。

更详细的事件经过请查看以下网站:http://bbs.tianya.cn/post-100-1137194-1.shtml

在这里插入图片描述

在这里插入图片描述

英文原文课件下载地址:

http://page2.dfpan.com/fs/9l8c8jd262f1f2c9163/

更多精彩文章请关注微信号:在这里插入图片描述

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值