交大软院第一次开机器学习课,实在不知道老师在上什么,我就一边摸索着一边写博客记录一下。
1.获取CSV数据
- 从手机价格预测分类数据获取到CSV文件
根据项目要求 进行8:1:1的train-valid-test分割。
2.处理CSV
处理csv的方法有很多,可以利用python的CSV库,不过最好使用主流的pandas来操作
pandas预备知识
- Dataframe : Two-dimensional, size-mutable, potentially heterogeneous tabular data.
- Series : One-dimensional ndarray with axis labels (including time series).
- 具体见pandas相关文章