传统机器学习
文章平均质量分 60
LandH的Blog
这个作者很懒,什么都没留下…
展开
-
[Machine Learning] 逻辑回归应用之Kaggle泰坦尼克之灾
主要学习数据处理的思路。作者: 寒小阳 时间:2015年11月。 出处:http://blog.csdn.net/han_xiaoyang/article/details/49797143 声明:版权所有,转载请注明出处,谢谢。1.引言先说一句,年末双十一什么的一来,真是非(mang)常(cheng)欢(gou)乐(le)!然后push自己抽出时间来写这篇blo转载 2018-01-16 15:12:58 · 840 阅读 · 0 评论 -
[机器学习]三行代码快速划分交叉训练中训练集和验证集
使用numpy.random.choice()和set()快速划分交叉训练数据集之前在划分训练集和验证集时,都是手工随机生成index,很笨。学到的新方法如下:import numpy as np# 正态分布生成原始数据x = np.random.random.normal(1,0.1,100)# 按8:2分割数据x_train_index = np.random.choi...原创 2018-03-01 11:42:06 · 3514 阅读 · 0 评论 -
[machine learning] 独热编码one hot encoding 及 MNIST label 独热编码范例
1. 为什么要用one hot encoding在实际场景中,变量非连续数值,而是离散数据时,采用暴力赋值,会给数据一个潜在的排序权重。换言之,各向量之间的距离不等。例如:性别(男,女),我们可以暴力转码为(0,1),没问题。但是性别(男,女,人妖),如果暴力转码为(0,1,2),“男”/“女”、“男”/“人妖”间的向量距离不等,就提供了一个潜在的大小排序,会影响输出结果。为了解决上述问题,其中一...原创 2018-01-24 13:53:49 · 2801 阅读 · 0 评论 -
机器学习中的敏感性和特异性的概念
敏感性 Sensitivity敏感性又称真阳性率,就是发病之后,你的诊断方法对疾病的敏感程度(识别能力)。敏感性越高,漏诊概率越低。特异性 Specificity特异性又称真阴性率,不发病(我们这里称之为健康)的特征是有别于发病的特征的,我们利用这些差异避免误诊,那么诊断标准对于这些差异利用的如何就用特异性来表示。特异性越高,确诊概率越高。举个例子 样本...原创 2018-02-23 13:35:54 · 28808 阅读 · 1 评论