python3 机器学习sklearn之简介

本文介绍了机器学习的基础知识,包括监督学习、无监督学习等,并重点讲解了Python Scikit-learn库,这是一个强大的机器学习库,依赖于NumPy、SciPy和matplotlib。文中详细阐述了如何使用sklearn加载波士顿房价、鸢尾花和手写数字数据集,并展示了数据集的使用示例。sklearn库涵盖了分类、回归、聚类、降维等任务的工具,是进行机器学习实践的重要资源。
摘要由CSDN通过智能技术生成

1.机器学习简介

机器学习是实现人工智能的手段,其主要研究内容是如何利用数据或经验进行学习 ,改善具体算法的性能

  • 多领域交叉,涉及概率论、统计学,算法复杂度理论等多门学科
  • 广泛应用于网络搜索、垃圾邮件过滤、推荐系统、广告投放、信用评价、欺诈检测、股票交易和医疗诊断等应用

2.机器学习分类

机器学习一般分为下面几种类别:

  • 监督学习 (Supervised Learning)
  • 无监督学习 (Unsupervised Learning)
  • 强化学习(Reinforcement Learning,增强学习)
  • 半监督学习(Semi-supervised Learning)
  • 深度学习 (Deep Learning)

3. Python Scikit-learn

这里写图片描述

4.sklearn库中的标准数据集

4.1数据集总览

image.png

4.2波士顿房价数据集

波士顿房价数据集包含506组数据,每条数据包含房屋以及**房屋
周围的详细信息**。其中包括城镇犯罪率、一氧化氮浓度、住宅平均房
间数、到中心区域的加权距离以及自住房平均房价等。因此,波士顿
房价数据集能够应用到回归问题上。

4.2.1波士顿房价数据集

image.png

4.2.3波士顿房价数据集-属性描述

image.png

4.2.4波士顿房价数据集的使用

使用sklearn.datasets.load_boston即可加载相关数据集
其重要参数为:
* return_X_y:表示是否返回target(即价格),默认为False,只返回data(即属性)。

波士顿房价数据集-加载示例

from sklearn import datasets
boston = datasets.load_boston()
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值