机器学习-Sklearn

最新推荐文章于 2024-06-29 22:51:21 发布

大美mixer

最新推荐文章于 2024-06-29 22:51:21 发布

阅读量352

点赞数

分类专栏：机器学习学习笔记

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_34746896/article/details/85110369

版权

机器学习学习笔记专栏收录该内容

7 篇文章 0 订阅

订阅专栏

本文介绍了Python机器学习库Sklearn的安装与高级使用，包括数据标准化、神经网络检验等。通过实例展示了如何利用Sklearn进行分类、回归和数据预处理，强调了数据标准化的重要性，并探讨了评估模型正确率的多种方法。

摘要由CSDN通过智能技术生成

一下子看完这个网址不用跳跳跳点点点系列

学习网址：机器学习 (Machine Learning) - Sklearn | 莫烦Python

通常来说, 机器学习的方法包括:

监督学习 supervised learning;

非监督学习 unsupervised learning;

半监督学习 semi-supervised learning;

强化学习 reinforcement learning;

遗传算法 genetic algorithm.

那我们为什么要选择Sklearn呢？

Scikit learn 也简称 sklearn, 是机器学习领域当中最知名的 python 模块之一.

Sklearn 包含了很多种机器学习的方式:

Classification 分类

Regression 回归

Clustering 非监督分类

Dimensionality reduction 数据降维

Model Selection 模型选择

Preprocessing 数据预处理

安装Sklearn吧

最简单的方法就是使用pip

打开命令窗口输入：pip3 install-Uscikit-learn

注：我电脑为win64，已安装python3、numpy等。

官网是最好的教程：scikit-learn: machine learning in Python — scikit-learn 0.20.0 documentation

在兴奋的码代码之前，首先要选择你需要的算法！

算法分为分类，回归，聚类，降维四类。

监督——分类和回归

非监督——聚类

除此之外，还需要考虑数据集的大小。例如当数据量<50时，就需要增加数据量。

首先尝试一下分类器的使用！KNN classifier！

目的：根据花的属性将花分类。

基本思路：选择几个临近点，综合它们做个平均来作为预测值。

好像跟matlab有异曲同工之妙。。。

接下来我们来看看Sklearn强大的数据库 data sets。

可用数据网址：API Reference — scikit-learn 0.20.0 documentation

好像跟前面差不多~~

当然我们也可以自己生成虚拟数据：

高级使用

数据标准化

在进行数据标准化之前，我们首先要搞清楚什么是数据标准化？为什么要进行数据标准化？由于参加过数学建模比赛的同学应该知道，没参加过的请自行百度。总之不要看了别人跟你展示正确率提高了之后，将“提升准确率”作为说服你进行数据标准化的理由。

检验神经网络

我们如何检验一个网络的正确率从而改进网络呢？

第一种方法：之前提到的“训练组与测试组”。

就像考试结束我们来对照正确答案给个分数~

第二种方法：误差曲线。

说白了就是误差的可视化。跌宕起伏的曲线肯定不好。

误差曲线的反面是准确度曲线，其实就是跟误差曲线互补。

第三种方法：正规化——解决Overfitting问题。

第四种方法：交叉验证——确定哪样的参数能够更有效的解决现有的问题

后面的就不写了，交叉验证什么的，只起到了了解的作用。

后记：下次一定用markdown

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

大美mixer CSDN认证博客专家 CSDN认证企业博客

码龄8年

53: 原创

73万+: 周排名

105万+: 总排名

1万+: 访问

: 等级

270: 积分

30: 粉丝

20: 获赞

17: 评论

70: 收藏

私信

关注

热门文章

分类专栏

最新评论

数据仓库快速入门
普通网友: 基于Flink+Doris构建高性能高扩展的全端实时数据仓库教程网盘地址：https://pan.baidu.com/s/1GmMaOQ6gl1_zUPmFuy0gyQ 提取码: gmq7
PAT A 1124 1125 1126 1127
吃西瓜瓜回复吃西瓜瓜: 怎么乱码了，a小于b小于c，那么（a+b）/2小于c
PAT A 1124 1125 1126 1127
吃西瓜瓜: 1125第2种方法也可以的原因是，三个数从小到大排序，a<b<c，那么（a+b）/2<c
宇宙无敌PAT-A不完全考纲
iroy33 回复大美mixer: 无损学姐的优秀~
宇宙无敌PAT-A不完全考纲
大美mixer 回复 iroy33: 尼玛居然少打了一个负号。。。

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。