【跟李沐学AI】2.1 探索性数据分析

文章目录

2.1 探索性数据分析【斯坦福21秋季:实用机器学习中文版】

视频地址:https://www.bilibili.com/video/BV1Xh411p7M9?spm_id_from=333.999.0.0

文字地址:https://www.bilibili.com/read/cv13353927?from=note

教学大纲:https://c.d2l.ai/stanford-cs329p/syllabus.html#deep-network-tuning

课程代码:https://c.d2l.ai/stanford-cs329p/_static/notebooks/cs329p_notebook_eda.slides.html#/12

数据集获取:
!wget https://c.d2l.ai/stanford-cs329p/_static/house_sales.ftr
data = pd.read_feather('house_sales.ftr')
data = pd.read_csv('house_sales.zip') # csv文件这样读取

收获:

  1. csv文件存下来相对比较大,可以先压缩成一个zip或一个tar,主流的读取文件都可以从压缩文件中读取。建议存成压缩文件,在传输存储都会比较好,甚至还会比直接读取还要好(这个方法可用于文本)
  2. In[6] 中的 inplace的作用是,直接将要去掉的列给改写掉(直接对数进行修改),可以省些内存,但是这个只能跑一次
  3. from IPython import display display.set_matplotlib_formats('svg') svg格式,显示图片更清晰
  4. 箱型图:搞懂箱形图分析
  5. 协方差矩阵 分析 相关性
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值