机器学习:python实践
文章平均质量分 82
机器学习:python实践
余欲与鱼语渔
纸得终潜,绝需躬行。
主要是做笔记,分享是其次。有问题欢迎讨论~
展开
-
Python机器学习之四:特征选择
数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限而已。特征过程的本质就是一项工程活动,目的是最大限度地从原始数据中提取合适的特征,以供算法和模型使用。特征选定是一个流程,能够选择有助于提高预测结果准确度的特征数据,或者有助于发现我们感兴趣的输出结果的特征数据。如果数据中包含无关的特征属性,会降低算法的准确度,对预测新数据造成干扰,尤其是线性相关算法(如线性回归算法和逻辑回归算法)。...原创 2020-11-01 23:06:57 · 1337 阅读 · 0 评论 -
Python机器学习之三:数据转换(归一化、标准化、正则化、二值化)
在机器学习的应用开发中,最基础的是特征工程。 ——吴恩达示例使用数据集:Pima Indian的数据集我们先导入数据,并将特征与目标划分为X,Y:import pandas as pdimport numpy as npfilename='pima_data.csv'dataset=pd.read_csv(filename)#将数据分为输入和输...原创 2020-11-01 19:29:53 · 1761 阅读 · 2 评论 -
Python机器学习之二:数据审查、特征数据可视化
案例使用Pima Indians数据集,下载链接(https://gitee.com/biabianm/pima-indians-diabetes)1.数据导入历史数据通常会以CSV的格式来存储,或者能够方便地转化为CSV格式。CSV 文件是用逗号分隔的文本文件。审查CSV文件:(1)是否有文件头如果CSV的文件里包括文件头的信息,可以很方便地使用文件头信息来设置读入数据字段的属性名称。...原创 2020-10-29 16:49:37 · 1351 阅读 · 0 评论 -
Python机器学习之一:导入数据(CSV、NumPy、Pandas)
历史数据通常会以CSV的格式来存储,或者能够方便地转化为CSV格式。CSV 文件是用逗号分隔的文本文件。审查CSV文件:(1)是否有文件头如果CSV的文件里包括文件头的信息,可以很方便地使用文件头信息来设置读入数据字段的属性名称。如果文件里不含有文件头信息,需要自己手动设定读入文件的字段属性名称。数据导入时,设置字段属性名称,有助于提高数据处理程序的可读性。(2)文件中的注释在 CSV ...原创 2020-10-29 16:26:57 · 4540 阅读 · 0 评论 -
《机器学习:Python实践》笔记:机器学习中的Hello World项目—鸢尾花分类详解
针对鸢尾花(Iris Flower)进行分类的一个项目,数据集是含鸢尾花的三个亚属的分类信息,通过机器学习算法生成一个模型,自动分类新数据到这三个亚属的某一个中。项目中使用的鸢尾花数据集是一个非常容易理解的数据集,这个数据集具有以下特点:· 所有的特征数据都是数字,不需要考虑如何导入和处理数据。· 这是一个分类问题,可以很方便地通过有监督学习算法来解决问题。· 这是一个多分类问题,也许需要一...原创 2020-05-03 23:10:04 · 1833 阅读 · 1 评论