![](https://img-blog.csdnimg.cn/20201014180756925.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
机器学习
文章平均质量分 54
机尾云拉长
我不更博客好多年。。。
展开
-
决策树之分类树快速理解
先来看这样一个表格 这就是一个数据集,只是特征向量的数目只有8条,可以看到已经分好类了,就是是否放贷,每一条特征向量都包含三个特征:有房?有工作?年收入 我们的终极问题是:哪个特征对分类结果的影响最大?换句话说,按照哪一个特征分类最准确,最接近实际分类结果? 所以我们想:要是准确性能够量化就好了,怎么量化?伟大的香农做到了 来,我们翻一翻信息论: 1:信息熵 我们在中学学过熵的概念...原创 2018-09-08 11:41:48 · 1470 阅读 · 1 评论 -
LightGBM常用模板
LightGBM是个快速的、分布式的、高性能的基于决策树算法的梯度提升框架。可用于排序、分类、回归以及很多其他的机器学习任务中lgb.LGBMClassifier()用于分类模板一:import lightgbm as lgbprint("LGB test")clf = lgb.LGBMClassifier( boosting_type='gbdt', num_leave...转载 2018-12-01 12:07:43 · 1466 阅读 · 0 评论 -
《Tensorflow 实战google深度学习框架》第二版源代码
<<Tensorflow 实战google深度学习框架–第二版>>完整资料github地址:https://github.com/caicloud/tensorflow-tutorial源代码链接:https://github.com/caicloud/tensorflow-tutorial/tree/master/Deep_Learning_with_Tensor...原创 2018-12-05 14:49:44 · 837 阅读 · 0 评论 -
搭建hadoop和spark分布式环境
root权限密码:本机&lt;15 Ubuntu的密码是:204Spark的分布环境需要基于HDFS,所以在装spark之前我们需要先配置hadoop分布式系统:1.实验做啥:基本:配置完成hadoop环境延伸:配置完成spark环境(实验二的部分内容)Hadoop 集群的安装配置大致为如下流程:1.选定一台机器作为 Master2.在 Master 节点上配置 hadoop 用户、...原创 2019-01-10 13:04:52 · 1117 阅读 · 0 评论 -
Anaconda3+Python3.6搭建Tensorflow
安装Tensorflow有两种方式:pip及Anaconda一:pippip:本地pip直接在您的系统上安装TensorFlow,而无需通过虚拟环境。由于本地pip安装不在单独的容器中,因此pip安装可能会干扰系统上其他基于Python的安装。但是,如果您了解pip和Python环境,则本地pip安装通常只需要一个命令!此外,如果使用本地pip进行安装,则用户可以从系统上的任何目录运行Tens...原创 2019-01-09 21:12:29 · 8853 阅读 · 0 评论 -
贝叶斯决策理论对CIFAR-10数据图像分类
1:数据集介绍CIFAR-10 是一个用于普世物体识别的数据集,分为airplane、automobile、bird、cat、deer、dog、frog、horse、ship、truck共10 类。共60000张32*32大小的彩色RGB图像,分为10类,50000张用于训练,10000张用于测试。训练集分为5个训练batches,测试集分为1个测试batch。每个batch有10类,每类...原创 2019-01-09 21:43:36 · 3344 阅读 · 4 评论 -
用SVD和字典学习方法重建图像(cifar-10图片集)
1:SVD算法1.1 算法原理奇异值分解(SVD)是线性代数中一种重要的矩阵分解。假设M是一个m×n阶矩阵,其中的元素全部属于域K,也就是实数域或复数域。如此则存在一个分解使得M=UΣV∗M=UΣV^*M=UΣV∗其中U是m×m阶酉矩阵;Σ是m×n阶非负实数对角矩阵;而V*,即V的共轭转置,是n×n阶酉矩阵。这样的分解就称作M的奇异值分解。Σ对角线上的元素Σi,i即为M的奇异值。常见的做法是...原创 2019-01-09 22:10:40 · 3484 阅读 · 10 评论 -
使用smo算法编写svm对CIFAR-10数据分类
公式太难打了,弄成图片,可能不太美观,但知识没变味3:实验内容3.1 提取hog特征本实验的核心在于设计svm算法,因此提取特征使用库函数实现,最主要代码如下from skimage import feature as ftft.hog(data[i],feature_vector=True,block_norm='L2-Hys',transform_sqrt=True)3....原创 2019-01-23 15:37:18 · 831 阅读 · 2 评论 -
EM算法最完整易懂讲解
原创 2019-09-18 14:31:02 · 412 阅读 · 1 评论 -
sklearn中, fit,fit_transform,transform的区别与联系
文章乃转载scikit-learn提供了一系列转换库,他们可以清洗,降维,提取特征等。在数据转换中有三个很重要的方法,fit,fit_transform,transformss=StandardScaler()X_train = ss.fit_transform(X_train)X_test = ss.transform(X_test)初学时候好奇为何,训练样本用fit_transfo...转载 2018-11-29 21:21:10 · 1051 阅读 · 0 评论 -
K-SVD字典学习算法
1.提出问题:什么是稀疏表示假设我们用一个MN的矩阵表示数据集Y,每一行代表一个样本,每一列代表样本的一个属性,一般而言,该矩阵是稠密的,即大多数元素不为0。稀疏表示的含义是,寻找一个系数矩阵X(KN)以及一个字典矩阵D(MK),使得DX尽可能的还原Y,且X尽可能的稀疏。X便是Y的稀疏表示。算法思想算法求解思路为交替迭代的进行稀疏编码和字典更新两个步骤. K-SVD在构建字典步骤中,K-S...原创 2018-11-24 12:53:33 · 3228 阅读 · 3 评论 -
什么是机器学习
机器学习 关注的问题:计算机程序如何随着经验积累自动提升性能 怎样设计一个学习系统? 学习的定义:对于某类任务T和性能度量P,如果一个计算机程序在T上以P衡量的性能能随着经验E而自我完善,我们成这个计算机程序从经验E中学习 设计学习系统,必须明确三个特征:学习任务T,性能衡量标准P,经验来源E 例如: 手写识别学习问题 学习任务T: 识别分类图像中的手写文字 性能衡量标准P:分类...原创 2018-09-09 14:36:13 · 902 阅读 · 0 评论 -
KNN分类算法简解
本篇文章旨在帮助小伙伴们最快速地理解KNN KNN算法即K-邻近算法,他可以解决这样的问题: 我手里有数据集,可以将其想象成一堆人,这些人都已经分好类了,根据什么分的类呢?根据一些我们约定的特征(比如身高,性别,爱好啊等等…) 我想要干什么呢? 是这样,现在我拉来一个新人,我把他输入到KNN,KNN就有了个输出,即:这个新人是属于哪一类 伪代码是这样的: 1:计算已知类别数据集中的点与...原创 2018-09-07 15:59:43 · 664 阅读 · 0 评论 -
贝叶斯估计和极大似然估计
在开始接触最大似然估计和贝叶斯估计时,大家都会有个疑问:最大似然估计和贝叶斯估计二者很相似,到底有何区别?本文便来说说二者的不同之处以及求参模型的公式推导!预热知识必知如何求类条件概率密度: 我们知道贝叶斯决策中关键便在于知道后验概率,那么问题便集中在求解类条件概率密度!那么如何求呢?答案便是:将类条件...转载 2018-10-20 11:18:33 · 1499 阅读 · 0 评论 -
卡尔曼滤波
卡尔曼滤波(Kalman filtering)一种利用线性系统状态方程,通过系统输入输出观测数据,对系统状态进行最优估计的算法。由于观测数据中包括系统中的噪声和干扰的影响,所以最优估计也可看作是滤波过程,滤除噪声干扰。通常情况下,卡尔曼滤波用于将多个来源的数据进行融合,适用于随机线性离散系统状态估计和参数估计我们看一个离散控制过程的系统,它包括一个状态方程和一个测量方程这里所有的变量其实...原创 2018-10-20 12:10:04 · 2384 阅读 · 0 评论 -
最大期望算法 (EM算法)
注:文章出处:https://www.cnblogs.com/yahokuma/p/3794905.html算法定义&amp;nbsp; &amp;nbsp; &amp;nbsp; 最大期望算法(Exception Maximization Algorithm,后文简称EM算法)是一种启发式的迭代算法,用于实现用样本对含有隐变量的模型的参数做极大似然估计。已知的概率模型内部存在隐含的变量,导致了不能直接用极大似然法来...转载 2018-10-21 16:54:05 · 3129 阅读 · 0 评论 -
基于PCA和贝叶斯决策对CIFAR-10数据图像分类
1:数据集介绍CIFAR-10 是一个用于普世物体识别的数据集,分为airplane、automobile、bird、cat、deer、dog、frog、horse、ship、truck共10 类。共60000张32*32大小的彩色RGB图像,分为10类,50000张用于训练,10000张用于测试。训练集分为5个训练batches,测试集分为1个测试batch。每个batch有10类,每类...原创 2018-11-20 22:34:24 · 4874 阅读 · 4 评论 -
奇异值分解(SVD)及其应用
机器学习中的数学(5)-强大的矩阵奇异值分解(SVD)及其应用 版权声明: 本文由LeftNotEasy发布于http://leftnoteasy.cnblogs.com, 本文可以被全部的转载或者部分使用,但请注明出处,如果有问题,请联系wheeleast@gmail.com。也可以加我的微博: @le...转载 2018-11-22 10:43:56 · 731 阅读 · 0 评论 -
字典学习与稀疏表示
假设我们用一个M*N的矩阵表示数据集X,每一行代表一个样本,每一列代表样本的一个属性,一般而言,该矩阵是稠密的,即大多数元素不为0。 稀疏表示的含义是,寻找一个系数矩阵A(K*N)以及一个字典矩阵B(M*K),使得B*A尽可能的还原X,且...原创 2018-11-22 17:06:36 · 4003 阅读 · 1 评论 -
常用概率论矩阵论公式
bayes公式a,b,c是不同的随机变量原创 2019-09-18 14:44:57 · 1275 阅读 · 0 评论