记——实现机器学习的流程初步理解

1.读取数据(pandas)

读取csv、xls文件等

2.数据预处理、分析(pandas)

  • 预处理工作:缺少列头、分割字段、索引号处理、删除行列、处理空值、处理重复行、日期处理、文件保存等。

  • 分析:条件过滤、排序、分类汇总等。

3.数据分析

特征工程(sklearn.preprocessing):

  • 使用Sklearn预处理模块:preprocessing
  • 数据归一化正则化(preprocessing.normalize():作用:把数据收敛到[0,1]之间
  • 数据标准化(preprocessing.scale()) 作用:缩放处理 均值为0,方差为1

4.挖掘(sklearn(机器学习)、numpy(数组矩阵)、metrics(模型效果验证)):

  • 设置一个数据集X 【不能是一维数组】,和一个标签集y,
  • 选取模型(选择算法:回归、分类、聚合、降维):model=模型()
  • 模型拟合:model.fit(x,y)
  • 根据x值,预测y值:print“y_predicted=”,model.predict(x)

模型调优正在学习,之后再添加.

  • 后记:
    有需要的朋友可以搜索微信公众号:【知音库
    这里有个人总结的文章,本人是大数据专业学生,
    同时也是为了鼓励自己,坚持写笔记,希望可以共同进步。
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值