自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(16)
  • 收藏
  • 关注

原创 自然语言处理_nltk的使用

【1】http://blog.csdn.net/huyoo/article/details/12188573

2017-12-27 21:05:43 206

原创 机器学习_sklearn-特征选择

【1】http://sklearn.lzjqsdd.com/modules/feature_selection.html文档【1.5】http://d0evi1.com/sklearn/feature_selection/更详细的博客【2】移除方差低的特征:eg某一特征全为1,没有区分性则移除【3】单变量特征选择:通过单变量统计检查来选择最佳参数:eg:卡方检验【4】递归特征消除:

2017-12-26 18:35:21 216

原创 机器学习_遗传算法

【1】遗传算法是一种解决问题的方法,它模拟大自然中种群在选择压力下的演化,得到问题的一个近似解。【2】遗传算法是用计算机去模拟进化的过程。包括遗传(染色体分离)、变异、淘汰、终止。【3】https://www.zhihu.com/question/23293449    这篇文章讲的很好。【4】遗传算法流行的原因:很多时候其实并不需要一个完美的答案;很多问题需要完美的答案时,需要大量的

2017-12-23 17:16:21 712

原创 机器学习_多类问题

【1】目的:将单类问题转化为n类问题【2】思路一:n的分类器,将第i类与其他n-1类整体分开【3】思路二:n*(n-1)/2个分类器,将第i类与其他的每一类分开

2017-12-22 20:49:54 159

原创 数据挖掘_数据流挖掘

.

2017-12-22 16:45:47 755

原创 python语言_ if __name__=='__main__’/并行问题

【1】解决的方法是:加   if __name__=='__main__’    【2】原理:python有两种执行情况:第一脚本执行,第二是import到其他python脚本中被调用   上文的代码是用来控制这两种情况的。【3】if __name__ == 'main'下的代码只有在python文件作为脚本才会执行。被调用不会被执行。【4】__name__会返回文件名   _

2017-12-19 19:22:15 341

原创 机器学习_模型效果不佳

【1】模型本身不适用于这个场景,比如分类你用线性回归,可以做设定阀值来分类。但是鲁棒性不强。【2】模型超参数设置不对【3】过拟合

2017-12-16 19:55:09 1311

原创 python_类型转换

【1】转换类型前,先明白他是什么数据类型。         array数据类型可通过a.dtype查看数据类型,通过a=a.astype(int)实现。【2】如何查看普通数据(非array)的数据类型,可参考http://blog.csdn.net/lg1259156776/article/details/52653813

2017-12-16 16:49:34 3340

转载 python_安装模块后出错:无法启动程序丢失vcom140.dll

(1)问题描述:我的环境是win7旗舰版64位,安装了python3.5.3。 给python3.5.3安装了运行库 lightgbm ,安装成功后,在python界面import lightgbm出错,问题是“无法启动程序丢失VCOMP140.DLL”(2)问题分析:电脑缺少VC++相关运行库,其中包括 VCOMP140.DLL文件(3)解决方法:下载VC++运行库(我的windows系

2017-12-16 15:23:51 2981

原创 机器学习_线性回归和逻辑回归(及python)

【1】线性回归和逻辑回归在根本不是一个东西,在损失函数中有体现。【2】线性回归的损失函数:要求点到之间的距离越小越好,要求点越接近于直线。【3】逻辑回归的损失函数:其中y的取值为{0、1},当y为1时,要求h(x)尽可能接近于1,-log(h(x))才会尽可能的小。h(x)为逻辑回归函数。本质为h(g(x)),h(x)接近于1在几何上体现为,g(x)接近于无穷,

2017-12-14 10:29:31 538

原创 机器学习_直线/平面的函数形式

【1】平面的函数形式:【1.1】点法式:A(x-x0)+B(y-y0)=0。很好理解(A,B)为法向量,(x0,y0)为平面内一点。【1.2】一般式:AX+BY+CZ+D=0总:所以除了支持向量机设的是平面,线性回归设的也是平面。不要曲解线性的意思!【2】直线和函数形式:【2.1】可以将两个平面联立得到直线的方程。

2017-12-13 10:43:23 2658 1

原创 机器学习_线性分类器

【1】线性分类器不同与贝叶斯分类器:不考虑训练样本的基本分布【2】判别式函数:理解g(x)在决策面的一边为正、一边为负:是由于点x1,x2....构成的某种组合正好为0。当一个变量发生变化(体现为线上点的移动),组合值就会不为0【3】感知机算法感知器算法设的分割平面如上g(x),目标函数的含义是使分错的点最小。假设为线性可分的情况:目标是找一条分类错误为0点线。

2017-12-12 21:47:26 452

原创 机器学习_初识attention

【1】NLP中有一类问题:给定一段上下文(context),生成一段与context相关的(target)         eg:翻译/阅读理解/摘要生成【2】这类问题需要RNN解码,用一个 RNN encoder读入context, 得到一个context vector(RNN的最后一个hidden state);然后另一个RNN decoder以这个hidden state为起始sta

2017-12-04 09:59:34 695

转载 机器学习_softmax

【1】初步认识什么是softmax【2】普通的max,是指我有两个数。a和b,并且a>b,取max就直接取a,没有第二种可能。【3】但是softmax,不想这样。他想让a经常性的取到,而b偶尔的取到,取到的概率和他本来的大小有关,所以不说max,而是softmax【4】https://www.zhihu.com/question/23765351

2017-12-02 17:03:15 188

转载 机器学习_RNN/长期依赖/LSTM

【1】转自http://www.jianshu.com/p/9dc9f41f0b29【2】人类并不是每时每刻从空白思考问题,是基于对先前所见词的理解来推断当前词的含义。【3】但是传统的神经网络不能做到这点,传统的神经网络输入之间是独立的,代表着新物质的构成。?????对么【4】RNN解决了这个问题,RNN时循环的网络允许信息的持久化,即基于原始的信息去处理新的信息。【5】链

2017-12-02 11:30:14 3618

原创 机器学习_内积/相关系数/协方差/标准差之间的联系

【1】若各样本均标准化为均值为0,那么内积=协方差【2】若各样本均标准化为均值为0,那么余弦值=相关系数

2017-12-01 20:42:18 2266

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除