自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(11)
  • 收藏
  • 关注

原创 统计学习方法感知机算法Python实现

import numpy as npimport matplotlib.pyplot as pltclass MyPerception: def __init__(self): """ 完成对于权值,偏置和学习率的初始化 """ self.w = None # 权值 self.b = 0 # 偏置 ...

2019-07-07 14:53:03 132

原创 局部加权线性回归和岭回归

"""线性回归的一个问题就是有可能出现欠拟合现象,因为它求的是具有最小均方误差的无偏估计,显而易见,如果模型欠拟合将不能取得最好的预测效果,所以有些方法允许在估计中引入一些偏差,从而降低预测的均方误差"""from numpy import *import matplotlib.pyplot as pltdef loadDataSet(fileName): """ ...

2019-07-05 08:21:06 140

原创 线性回归计算回归系数

"""线性回归: 优点:结果易于理解,计算上不复杂 缺点:对非线性的数据拟合不好 适用数据类型:数值型和标称型数据 标称型数据:一般在有限的数据中取,而且只存在“是”和“否”两种不同的结果(一般用于分类) 数值型数据:可以在无线的数据中取,而且数值比较具体化,例如4.02, 6.23这种值(一般用于回归分析)回归的一般方法: 1收集数据:采用任...

2019-07-04 09:38:38 5121

原创 决策树判断海洋生物是否为鱼类

"""优点:计算复杂度不高,输出结果易于理解,对中间值的缺失不敏感,可以处理不相关特征数据缺点:可能会产生过度匹配问题运用数据类型:数值型和标称型决策树的一般流程: 1.收集数据:可以使用任何方法 2.准备数据:树构造算法只适用于标称型数据,因此数值型数据必须离散化 3.分析数据:可以使用任何方法,构造树完成后,我们应该检查图形是否符合预期 4.训练算法:构...

2019-06-24 19:31:54 912

原创 使用k-近邻算法完成手写识别系统

"""(1) 收集数据:提供文本文件(2) 准备数据:编写函数classify0,将图像格式转换为分类器使用的list格式(3) 分析数据:在python命令提示符中检查数据,确保它符合要求(4) 训练算法:此步骤不适合用于k-近邻算法(5) 测试算法:编写函数使用提供的部分数据集作为测试样本,测试样本与非测试样本的区别在于测试眼gv恩是已经完成分类的数据,如果预测分类与实际类别不同则...

2019-05-14 11:07:14 177

原创 k-近邻算法在约会网站上的使用

"""(1) 收集数据:提供文本文件(2) 准备数据:使用Python解析文本文件(3) 分析数据:使用Matplotlib画二维扩散图(4) 训练算法:此步骤不适用k-近邻算法(5) 测试算法:使用海伦提供的部分数据作为测试样本 测试样本和非测试样本的区别在于:测试样本是已经完成分类的数据,如果预测分类与实际样本类别不同 则标记为一个错误(6) 使用算法:产生简单的命令行程序,然...

2019-05-13 08:54:50 92

原创 k-近邻算法在约会网站上的使用

"""(1) 收集数据:提供文本文件(2) 准备数据:使用Python解析文本文件(3) 分析数据:使用Matplotlib画二维扩散图(4) 训练算法:此步骤不适用k-近邻算法(5) 测试算法:使用海伦提供的部分数据作为测试样本 测试样本和非测试样本的区别在于:测试样本是已经完成分类的数据,如果预测分类与实际样本类别不同 则标记为一个错误(6) 使用算法:产生简单的命令行程序,然...

2019-05-12 22:35:07 158

原创 k-NN算法实现k-邻近算法实现

"""将数据点(1, 1.1)定义为类A, 数据点(0, 0.1)定义为类Bk-邻近算法实现: 1.计算已知类别数据集中的点与当前点之间的距离 2.按照距离递增次序排序 3.选取与当前点距离最小的k个点 4.确定前k个点所在的类别的出现频率 5.返回前k个点出现频率最高的类别作为当前点的预测分类"""from numpy import *impor...

2019-05-12 13:42:55 173

原创 在ipython3下如何将常用模块的目录添加到模块的搜索路径下

2019-05-11 16:19:08 279

原创 线性回归岭回归预测波士顿房价

"""正规方程:sklearn.linear_model.LinearRegression(最小二乘法线性回归)更准确 使用于线性模型梯度下降:sklearn.linear_model.SGDRegressor(最小二乘法线性回归)适合数据量大 适用于各种类型的模型线性回归需要进行标准化处理"""# 导入波士顿房价数据集from sklearn.datasets im...

2019-05-08 20:24:09 2148

原创 线性回归预测波士顿房价

"""正规方程:sklearn.linear_model.LinearRegression(最小二乘法线性回归)更准确 使用于线性模型梯度下降:sklearn.linear_model.SGDRegressor(最小二乘法线性回归)适合数据量大 适用于各种类型的模型线性回归需要进行标准化处理"""# 导入波士顿房价数据集from sklearn.datasets im...

2019-05-08 18:02:09 494

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除