python之scikit-learn

本文介绍了使用Python的scikit-learn库进行机器学习的流程,包括特征工程、模型选择、模型调整和模型融合。提到了数据分析在发现规则中的作用,以及监督学习、无监督学习和强化学习的概念。还讨论了数据预处理的标准化方法、模型评估的R^2得分以及模型参数调整,特别是logistic回归的超参数C和penalty。最后,文章提到了模型融合以提高预测性能。
摘要由CSDN通过智能技术生成

目录

特征工程

选择模型

调整模型

模型融合


官方文档:http://scikit-learn.org/stable/#

 

input--模型-output

数据分析是为了发现规则

数据分析--数据挖掘和机器学习,算法相同

推荐系统

语音识别--科大讯飞,百度垄断,比较成熟,自然语言的分支

机器视觉--卷积神经网络,图像识别,图片搜索,目标检测(无人驾驶)

NLP--聊天机器人,机器翻译,金融,與情分析

自动驾驶

垃圾邮件

自然语言??

监督学习:输入和输出之间有一定的关系,模型和标准是可靠的

无监督:聚类,分成几个类,评估和标准不可靠,有点问题

强化学习:aphago象棋程序

离散型、类别型

每列:特征(变量)==数据库的字段

每行:样本/样例

 

训练集-训练模型

测试集--评估模型

模型参数的训练

探索性分析

热力图 seaborn模块

几百万数据不算大?一般有多少数据?

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值