自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(10)
  • 收藏
  • 关注

转载 python机器学习第十一章:聚类分析——处理无类标数据

k-meansk-means(硬聚类)c-means(模糊聚类):需要指定先验的簇数量kk-means++算法让初始中心点彼此尽可能远离k-means性能判别标准:欧几里得距离的平方和(簇内误差平方和within-cluster sum of squared errors,SSE) 簇惯性(cluster intertia)肘方法确定簇的最佳数量:穷举另一种评估聚类质量的定量分析方法...

2019-05-30 21:23:06 839

原创 python中arange()和linspace()区别

arange()类似于内置函数range(),通过指定开始值、终值和步长创建表示等差数列的一维数组,注意得到的结果数组不包含终值。linspace()通过指定开始值、终值和元素个数创建表示等差数列的一维数组,可以通过endpoint参数指定是否包含终值,默认值为True,即包含终值。...

2019-04-24 19:40:46 263

原创 python机器学习第八章:集成学习——组合不同模型(自然语言处理)

词袋模型https://blog.csdn.net/sinat_29957455/article/details/79920492CountVectornizer类+TfidfTransformer类=TfidfVertornizer类tf词频(CountVectorizer类)tf-idf单词关联度(TfidfTransformer类)归一化0. 单词转化成特征向量(CountVec...

2019-04-24 19:39:51 648

原创 python机器学习第七章:集成学习——组合不同模型

·基于多数投票的预测·通过对训练数据集的重复抽样和随机组合降低模型的过拟合·通过弱学习机在误分类数据上的学习构建性能更好的模型集成学习集成⽅法(ensemble method)的⽬标是:将不同的分类器组合成为⼀个元分类器,与包含于其中的单个分类器相⽐,元分类器具有更好的泛化性能。理论验证:预测精度高于百分之五十时,集成方法可以显著提升预测准确度多数投票(majority voting)...

2019-04-24 19:39:43 2905

原创 python机器学习第六章:模型评估与参数调优实战

使⽤代码进⾏实践,通过对算法进⾏调优来构建性能良好的机器学习模型,并对模型的性能进⾏评估。我们将学习如下内容:1·模型性能的⽆偏估计2·处理机器学习算法中常⻅问题3·机器学习模型调优4·使⽤不同的性能指标评估预测模型基于流水线(pipline)的工作流1.使用pandas从UCI网站直接读取数据集:2.pipline对象拟合多个处理步骤的模型:Pipeline对象采⽤元组的序列...

2019-04-24 19:39:17 1377

原创 python机器学习第五章:通过降维压缩数据

本章将涵盖如下主题:1.⽆监督数据压缩——主成分分析(Principal Component Analysis,PCA)2.基于类别可分最⼤化的监督降维技术——线性判别分析(LinearDiscriminant Analysis,LDA)3.通过核主成分分析(kernel principal component analysis)进⾏⾮线性降维1.主成分分析 PCA…新的⼦空间上。PCA...

2019-04-24 19:39:08 744

原创 python机器学习第四章:数据预处理——构建好的训练数据集

1、缺失数据的处理知识点1:通过dropna方法将存在缺失值的特征或者样本删除#remove rows that contain missing values df.dropna(axis=0) #remove columns that contain missing values df.dropna(axis=1)#only drop rows where all columns ...

2019-04-24 19:38:59 2415

转载 python机器学习第三章:使用scikit-learn实现机器学习分类算法

训练机器学习算法所涉及的五个主要步骤可以概述如下:1、特征的选择2、确定性能评价标准3、选择分类器及其优化算法4、对模型性能的评估5、算法的调优感知器是机器学习分类算法中优雅易用的一个入门级算法,不过其最大的缺点在于:在样本不是 完全线性可分的情况下,他永远不会收敛。逻辑斯谛回归(logistics regression)分类模型 激励函数为sigmoid函数知识点1:skle...

2019-04-24 19:38:45 1186

转载 python机器学习第二章:机器学习分类算法

1、感知器收敛的前提是两个类别必须是线性可分的,激励函数为阶跃函数。2、Adeline 算法3、(批量)梯度下降 随机梯度下降 小批次梯度下降知识点1:Python zip()函数原文demodef fit(self,X,y): self.w_ = np.zeros(1+X.shape[1]) self.errors_ = [] f...

2019-04-24 19:38:32 522

转载 第一个FlaskWeb应用

2019-04-24 19:17:42 125

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除