- 博客(14)
- 资源 (5)
- 收藏
- 关注
原创 Linux下用uniq命令后丢失某些行
Linux下用uniq命令后丢失某些行原因对于系统不认识的字符,会被统统认为相同。 例如:我爱你a我爱你b我爱你c如果系统只认识中文,不认识英文,那么在系统眼里,它们都是我爱你<unkown char>此时如果要执行uniq命令之后,就会删除其中的两行,只留下我爱你a解决方法更改系统字符集设置(环境变量LANG),让系统认识这些...
2018-06-04 13:46:00 794
原创 贝叶斯决策、朴素贝叶斯、贝叶斯估计
概述在日常学习之中,我们经常能见到各种带有“贝叶斯”的词语,例如贝叶斯决策、朴素贝叶斯、贝叶斯估计,有时就会在诸如机器学习或者模式识别的课程上遇到它们中的一两个,学习的时候能把其中某个弄得清清楚楚,时间一长,反而这几个就有些混淆了,因此,集中进行学习整理。总结来说,朴素贝叶斯包含于贝叶斯决策,贝叶斯决策与贝叶斯估计的任务不同,它们都是基于贝叶斯定理去解决不同的问题;贝叶斯决策任务在于学习一个分类器,
2017-11-18 15:54:18 3198
原创 决策树笔记-CART算法
概述CART算法的提出比IDE3和C4.5还要早,它既可以应用于回归问题,也可以应用于分类问题。相同于IDE3和C4.5,CART算法也由以下两步组成: 1. 决策树生成 2. 决策树剪枝CART决策树的生成回归树的生成回归问题中,模型的输入输出都是连续的。 假设XX和YY分别为输入和输出变量,给定训练数据集: D=(x1,y1),(x2,y2),...,(xN,yN)D={(x_1,y_1
2017-11-17 11:41:27 898
原创 决策树笔记
概述决策树的生成特征选择信息增益熵条件熵信息增益信息增益比决策树的生成IDE3算法C45算法决策树的剪枝说明概述决策树是一种用来做分类的树形结构。 决策树的节点分为两种,内部节点和叶节点。内部节点表示一个特征或属性,叶节点表示分类结果。用决策树进行分类时,从根节点开始,对待分类实例的某一特征进行测试,根据测试结果将实例分配到子节点,如此递归进行下去,直到达到叶节点,即完成分
2017-11-16 14:23:50 629
原创 支持向量机笔记-软间隔支持向量机
支持向量机概述符号定义硬间隔支持向量机软间隔支持向量机对应的最优化问题回顾硬间隔支持向量机的优化问题改进以获得软间隔支持向量机优化问题优化问题最终形式学习算法算法原理说明支持向量机概述支持向量机的基础是定义在特征空间上的间隔最大的线性分类器。当训练数据线性可分时,通过硬间隔最大化学习一个线性分类器;当训练数据近似线性可分时,通过软间隔最大化学习一个线性分类器;当训练数据线性不可分
2017-11-14 12:22:10 1352 1
原创 支持向量机笔记-硬间隔支持向量机
概述符号定义硬间隔支持向量机函数距离几何距离几何间隔和函数间隔间隔最大化对应的最优化问题求解间隔最大化对应的最优化问题软间隔支持向量机核函数概述支持向量机的基础是定义在特征空间上的间隔最大的线性分类器。当训练数据线性可分时,通过硬间隔最大化学习一个线性分类器;当训练数据近似线性可分时,通过软间隔最大化学习一个线性分类器;当训练数据线性不可分时,通过使用核
2017-11-13 14:48:36 1389
原创 理解正则化项l1和l2的区别
防止过拟合的思路防止过拟合的思路就是让模型别那么复杂,简单点。 那么怎么能让模型简单点呢?有两个思路:减少参数的数量可想而知,参数越少模型越简单。减小参数的绝对值参数数量越少模型越简单,为什么参数绝对值越小模型越简单呢? 一个复杂的、容易过拟合的模型相比一个简单的、泛化能力更好的模型,往往表现为坑坑洼洼,没有后者平滑;平滑的模型,其导数绝对值(坡度)往往较小,而坑坑洼洼的模型,相对来说存在更多的
2017-11-05 20:53:26 1634 2
原创 sklearn错误解决:ValueError: Class label 0 not present
问题来源最近在使用sklearn中的svm进行文本分类的工作,在使用sklearn集成的Grid Search进行参数寻优的时候出现bug:ValueError: Class label 0 not present,将debug的结论记录在此。出错代码svr = SVC(kernel='rbf', probability=True, class_weight={0:1.0, 1:1.5})gam
2017-07-27 18:28:19 5158
原创 求对弈获胜概率的问题
问题描述甲乙两人对弈,单局甲获胜的概率为23\dfrac{2}{3},乙为13\dfrac{1}{3},现按照此规则对弈:任何一方获胜次数比对手多nn次,则获胜,如果一直未能满足这个条件,则一直对弈下去,求甲获胜的概率。n==1n==1时一局定输赢,甲获胜的概率为23\dfrac{2}{3}。n==2n==2时首先想明白以下3点: - 单数局不可能决出胜负,如果决出胜负,一定是偶数局; - 如果
2017-07-05 17:42:20 2717
原创 最大股票收益问题(数组最大差问题)
最大股票收益问题(数组最大差问题)问题描述给定一个数组,存储着按照时间排序的股票价格,第ii个位置的元素为第ii次交易时的股票价格;现假设只允许你进行一次买,然后在某一时刻卖出(单只股票),请设计算法,求解你可能获得的最大收益,如果股价是非增的,则收益为0。O(n2)O(n^2)解法将数组每个元素与其后的所有元素比较,选择增差最大的一对儿。 时间复杂度为: T(n)=(n−1)+(n−2)+..
2017-07-05 14:42:45 6011 1
原创 理解交叉熵损失(Cross-Entropy)
理解交叉熵损失字符集编码字符集编码的意义在于将数据集进行有效压缩。 假设在一个文档中只出现了a、b、c、d、e 5种字符,其占比如下表: 字符 a b c d e 占比 0.1 0.1 0.2 0.2 0.4最容易想到的编码方式,5个字符,需要3个bit位,故: 字符 a b c d e 单个字符编码长度期望值 编码
2017-06-28 16:29:11 8550 1
翻译 Ubuntu下deepnet的配置
//本文主要是将install.txt复述一遍,重点记录配置过程中中遇到的问题1.deepnet下载点击打开链接:https://github.com/nitishsrivastava/deepnet2.deepnet依赖1.Numpy2.Scipy3.CUDA Toolkit 及其 SDK设置如下环境变量(根据实际cuda安装位置对CU
2016-07-27 17:14:38 801
原创 Ubuntu下protobuf及其python runtime的安装
1.下载、解压protobuf#wget https://github.com/google/protobuf/releases/download/v3.0.0-beta-4/protobuf-python-3.0.0-beta-4.tar.gz#tar zxvf protobuf-python-3.0.0-beta-4.tar.gz2.安装protobuf compi
2016-07-25 12:38:43 3145
原创 Ubuntu 16.04 LTS下gnuplot的安装
1.自己从网上下载gnuplot并安装后,发现在引用时,并没有弹出绘图窗口。2.在终端输入gnuplot,显示有多个软件包包含该命令,其中包括gnuplot-nox gnuplot-qt等,貌似unbuntu中已经预装了gnuplot。3.根据提示,安装gnuplot-nox,命令行输入gnuplot,进入绘图软件,输入正弦函数画图命令:plot sin(x),成功弹出窗口。4.在py
2016-05-18 17:05:40 4176
直方图均衡化和线性变换(带简单界面)
2015-04-20
Thinking in C++.english
2014-05-04
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人