![](https://img-blog.csdnimg.cn/20201014180756754.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
算法
hllingg
叶子Q925848726
展开
-
聚类算法---层次聚类
假设有N个待聚类的样本,对于层次聚类来说,步骤:1.(初始化)把每个样本归为一类,计算每两个类之间的距离,也就是样本与样本之间的相似度;2.寻找各个类之间最近的两个类,把他们归为一类(这样类的总数就少了一个);3.重新计算新生成的这个类和各个旧类之间的相似度;4.重复2和3直到所有的样本点都归为一类,结束 整个聚类过程其实是建立了一棵树,在建立的过程中,可以通过在第二步上设置...原创 2018-12-04 15:29:28 · 530 阅读 · 0 评论 -
主成分(PCA)降维
主成分降维:主成分分析法是一种数学变换的方法,它把给定的一组相关变量通过线性变换转成另一组不相关的变量,这些新的变量按照方差依次递减的顺序排列。在数学变换中保持变量的总方差不变,使第一变量具有最大的方差,称为第一主成分,第二变量的方差次大,并且和第一变量不相关,称为第二主成分。依次类推,个变量就有个主成分。其中为维正交化向量(),之间互不相关且按照方差由大到小排列,则称为的第个主成分...原创 2018-12-29 17:43:07 · 898 阅读 · 0 评论 -
主成分降维python代码实现(承接上一篇)
# coding=utf-8import pandas as pdimport numpy as npfrom sklearn.decomposition import PCAfrom sklearn.preprocessing import StandardScalerdata = pd.read_csv("pca.csv") # 数据的导入# print(type(data))...原创 2018-12-29 18:06:17 · 1097 阅读 · 0 评论 -
模型评估
回归评估指标均方误差(MSE)MSE (Mean Squared Error)叫做均方误差。看公式 1m∑i=1m(yi−f(xi))21m∑i=1m(yi−f(xi))2均方根误差(RMSE)RMSE(Root Mean Squard Error)均方根误差。 1m∑i=1m(yi−f(xi))2−−−−−−−−−−−−−−−√1m∑i=1m(yi−f(xi))2 这是MSE开...转载 2019-01-07 18:13:29 · 1225 阅读 · 0 评论 -
逻辑回归和梯度下降
1. 概率1.1 定义 1.2 范围 1.3 计算方法1.3.1 根据个人置信1.3.2 根据历史数据1.3.3 根据模拟数据1.4 条件概率2.2.1 基本模型预测函数:用概率表示: 2.2 Cost函数线性回归: Cost函数: ...原创 2019-01-08 18:18:55 · 229 阅读 · 0 评论 -
梯度下降和逻辑回归例子(Python代码实现)
import numpy as npimport pandas as pdimport osdata = pd.read_csv("iris.csv") # 这里的iris数据已做过处理m, n = data.shapedataMatIn = np.ones((m, n))dataMatIn[:, :-1] = data.ix[:, :-1]classLabels = data...原创 2019-01-08 18:21:35 · 1807 阅读 · 0 评论 -
主成分分析降维(用Python中的PCA模块实现)
之前本人写过一篇用Python实现主成分降维的文章,现在想想感觉方法很麻烦,因为Python的PCA模块可以很容易的完成数据降维。下面附上代码# 主成分分析# coding=utf-8import pandas as pd# import numpy as npfrom sklearn.decomposition import PCA# from sklearn.preproce...原创 2019-01-25 17:31:56 · 1964 阅读 · 0 评论 -
K-近邻算法
K-近邻算法优点:精度高、对异常值不敏感、无数据输入假定。缺点:计算复杂度高、空间复杂度高。适用数据范围:数值型和标称型。工作原理:存在一个样本数据集合,也称作训练样本集,并且样本集中每个数据都存在标签,即我们知道样本集中每一数据与所属分类的对应关系。输入没有标签的新数据后,将新数据的每个特征与样本集中数据对应的特征进行比较,然后算法提取样本集中特征最相似数据(最近邻)的分类标签。...原创 2019-04-28 22:41:03 · 266 阅读 · 0 评论 -
读书总结--二分查找
感想:最近读了一本书,书名是《算法图解》个人觉得这本书挺好,里面讲了很多实用且易懂的算法,以后我会陆续的把自己的笔记搬到这上面,有兴趣的可以看一下。二分查找:二分查找是一种算法,其输入是一个有序的元素列表。如果要查找的元素包含在列表中,二分查找返回其位置;否则返回NULL。下面的例子说明了二分查找的工作原理。随便想一个1~100的数字。你的目的是以最少的次数猜到这个数字。你每次猜测后,...原创 2019-06-30 22:59:11 · 123 阅读 · 0 评论