自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(20)
  • 收藏
  • 关注

原创 机器学习算法——LR回归

一、Logistic回归原理及公式推导点击打开链接这样的方程一共有个,所以现在的问题转化为解这个方程形成的方程组,最后采用牛顿法或者梯度下降法进行求解。二、为什么逻辑回归比线性回归要好        线性回归在整个实数域内敏感度一致。而分类范围,需要在[0,1]之内,逻辑回归就是一种减小预测范围,将预测值限定为[0,1]间的一种回归模型,逻辑曲线在z=0时,十分敏感,在z>>0或z&l...

2018-05-07 16:50:58 347

转载 最小二乘法

第一种解读:最小二乘法,也叫最小平方法,在古汉语中“平方”称为“二乘”,“最小”指的是参数的估计值要保证各个观测点与估计点的距离的平方和达到最小。(记得赟哥解释过,这个方法起源于日本,就直接拿过来用了,其实最小平方法更好理解一点)最小二乘作为一种损失函数,也用做曲线拟合(曲线拟合求参数也是利用最小化平方的方法,其实也是作为一种损失函数,两个作用可以认为是一致的)在直线的 y = ax + b中,通...

2018-05-07 14:57:40 847

原创 机器学习算法——EM算法

EM算法是一种迭代算法,分为E、M两步。他就是含有隐变量的概率模型参数的极大似然估计法,或极大后验概率估计法  (将求已知量P(Y|θ)转换为求隐变量P(Y|Z,θ)P(Z|θ)的过程)       E步:利用当前估计的参数值,求出在该参数下隐含变量的条件概率值(计算对数似然的期望值);      M步:结合E步求出的隐含变量条件概率,求出似然函数下界函数的最大值(寻找能使E步产生的似然期望最大化...

2018-04-19 15:22:49 3759 1

转载 PCA

原文博客:点击打开链接,从PCA和SVD的关系拾遗:点击打开链接PCA主要用于特征降维,寻找最小均方意义下,最能代表原始数据的投影方法。典型应用就是人脸识别CA的缺点:PCA将所有的样本(特征向量集合)作为一个整体对待,去寻找一个均方误差最小意义下的最优线性映射投影,而忽略了类别属性,而它所忽略的投影方向有可能刚好包含了重要的可分性信息PCA的思想是将n维特征映射到k维上(k<n),这k维是...

2018-04-17 22:55:26 1201

原创 机器学习算法——使用 Apriori 算法进行关联分析

参考博客:点击打开链接,点击打开链接1、什么是关联分析?关联分析是一种在大规模数据集中寻找有趣关系的任务,这些关系可以有两种形式:频繁项集或者关联规则。频繁项集(frequent item set):是经常出现在一块的物品集合关联规则(association rules):暗示两种物品之间可能存在很强的关系2 Apriori理论算法的一般过程:收集数据:使用任何方法准备数据:任意数据类型都可以,因...

2018-04-16 14:23:31 626

原创 机器学习算法——支持向量机SVM

一、SVM面试常考问题参考博客:https://blog.csdn.net/szlcw1/article/details/52259668     SVM的优缺点:     优点:         1.适合对小样本数据学习,注重样本自身信息,而非产生样本的规律。          2.网络结构简单,只需一层(线性可分情况)或最多一个隐层(线性不可分情况),隐层的节点数由所求得的支持向量个数自行决定...

2018-04-03 15:13:21 531

原创 机器学习算法---kNN算法

一、KNN算法简介 (参考周志华的西瓜书)  KNN算法又称k近邻分类(k-nearest neighbor classification)算法。它是根据不同特征值之间的距离来进行分类的一种简单的机器学习方法,它是一种简单但是懒惰的算法。他的训练数据都是有标签的数据,即训练的数据都有自己的类别。KNN算法主要应用领域是对未知事物进行分类,即判断未知事物属于哪一类,判断思想是,基于欧几里得定理,判断...

2018-03-29 17:11:05 911

原创 浅谈C++中的buffer

一、C++中buffer是什么?1、buffer就是缓冲区的意思。当数据从其他地方接受过来在处理前,先保存至缓冲区,然后进行发送,主要用于处理能力或效率不相同的两个设备之间进行协调。2、buffer一般用来定义数组,因为它本身的意思就是“缓冲区”,在C语言里,数组就是个缓冲区,所以用常常用它。用它没有别的意思,就是方便记,可以用shuzu mydata甚至自己名字的拼音都行,主要是用它别人也很容易...

2018-02-19 16:12:30 19319

原创 机器学习算法——朴素贝叶斯

        朴素贝叶斯法是基于贝叶斯定理与特征条件独立假设的分类方法,对于给定的训练数据集,首先基于特征条件独立假设学习输入/输出的联合概率分布;然后基于此模型,对于给定的输入x,利用贝叶斯定理求出后验概率最大的输出y。朴素贝叶斯法实现简单,学习与预测的效率都很高,是一种常用的方法。朴素贝叶斯算法核心就两个: 贝叶斯定理朴素:假设各个特征之间是独立的1. 朴素贝叶斯的理论基础(参考李航课本)朴...

2018-02-14 22:21:15 1420

转载 C++实现to_string函数--int to string

本文是转载博客,用于自己的学习,原文博客点击打开链接to_string()函数返回字符串形式,功能就是将整型的数字,转化为字符串.例如:#include<iostream> #include<string> using namespace std; int main() { int i=123; //aastring s=...

2018-02-13 15:36:33 3043

转载 C++ 排序函数 sort()等函数的用法

函数名功能描述sort对给定区间所有元素进行排序stable_sort对给定区间所有元素进行稳定排序partial_sort对给定区间所有元素部分排序partial_sort_copy对给定区间复制并排序nth_element找出给定区间的某个位置对应的元素is_sorted判断一个区间是否已经排好序partition使得符合某个条件的元素放在前面stable_partition相对稳定的使得符合...

2018-02-10 20:19:37 303

原创 C++中两种常见形式的指针

写在前面:博主是纸灰级程序员,文中部分说法不具有权威性,只是个人学习的总结。在某客网上刷题,看到一大神的代码,其中对指针的引用和赋值较为罕见,故此写个总结。代码如下:TreeNode*pNode,TreeNode**pLastNodeInList这一行代码比较奇特,出现了*和**指针,通过下面代码轻松get:int a=1;int *b=&a;int **c=&b;再说一下*和...

2018-02-10 17:15:02 863

转载 C++ push方法与push_back方法 浅析

本文为转载博客,原文请参考:点击打开链接【摘要】push与push_back是STL中常见的方法,都是向数据结构中添加元素。初识STL,对于添加元素的方法以产生混淆,这里暂对两种方法作出比较分析。此外,本文还将简述push对应的stack与queue系列,常见方法的介绍,以及与push_back相对应的vector系列常见方法介绍。详见下文。list 也是使用 push_back .【正文】pus...

2018-02-08 22:26:36 976

原创 python中DictVectorizer的使用

在阅读《机器学习及实践》第三章这本书的时候,看到了DictVectorizer这一用法,后来在网上查询了有关该命令的用法,它是用于对特征进行抽取和向量化,有关代码如下:from sklearn.feature_extraction import DictVectorizer measurements = [ {'city': 'Dubai', 'temperature': 33.}...

2018-02-08 10:08:15 791

原创 浅谈C++中stack容器

2018-02-08 10:02:30 2105

原创 VS2013中无法定位程序输入点

2018-02-08 10:02:21 9976 2

原创 windows64位vs2013"模块计算机类型X64与目标计算机类型“X86"冲突解决方案

2018-02-08 10:02:05 3021

原创 C++中通过继承来建立派生类的方式

2018-02-08 10:01:48 464

原创 无监督学习——KMeans

      在K-Means算法中,聚类中簇的个数K是用户预先给定的值,k均值算法收敛到局部最小值,而非全局最小值(局部最小值指结果还可以但并非最好结果,全局最小值是可能的最好结果),用于度量聚类效果的指标是SSE(误差平方和),SSE值越小表示数据点越接近于他们的质心,聚类效果也越好。     为了改变K均值划分簇的结果:             1、将具有最大SSE值得簇划分为两个簇。    ...

2018-02-08 10:01:35 2893

转载 关于cmake的一些使用总结

一、cmake的常用命令基本语法规则:1.cmake变量使用${}方式取值,但是在IF控制语句中是直接使用变量名。2.环境变量使用$ENV{}方式取值,使用SET(ENV{VAR} VALUE)赋值。3.指令不区分大小写,一般推荐使用大写。    eg:指令(参数1 参数2…)    参数使用括弧括起,参数之间使用空格或分号分开。二、常用命令列表:   

2018-01-25 17:35:12 2775

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除