大数据
guomutian911
这个作者很懒,什么都没留下…
展开
-
【通俗解释】P_value 假设检验
故事一:教室里四位同学将装了若干数量的白球和黑球的箱子放在了课桌上,然后他们叫来了他们的小伙伴小花同学。他们对小花说:“小花,我们来玩个猜猜猜的游戏吧,你在这个箱子里摸5次球,每次摸完都要放回去再摸下一次,然后你猜里面的白球和黑球是不是一样多。”,小花就愉快地同意了。小花按照要求摸了三次球,每一次都是白球,这时她的心里已经有点怀疑白球和黑球是不是各一半了,她又继续摸,又摸了两次,还都是白球,这时她原创 2017-07-10 17:32:02 · 3733 阅读 · 0 评论 -
混淆矩阵(Confusion Matrix)分析
ContentConfusionMatrixExampleTalbe ofconfusionPreference Confusion Matrix在机器学习领域,混淆矩阵(confusion matrix),又称为可能性表格或是错误矩阵。它是一种特定的矩阵用来呈现算法性能的可视化效果,通常是监督学习(非监督学习,通常用匹配矩阵:matchin转载 2017-10-30 19:35:18 · 7822 阅读 · 0 评论 -
Sklearn-train_test_split随机划分训练集和测试集
sklearn.model_selection.train_test_split随机划分训练集和测试集官网文档:http://scikit-learn.org/stable/modules/generated/sklearn.model_selection.train_test_split.html#sklearn.model_selection.train_test_split一转载 2017-10-30 19:48:34 · 1430 阅读 · 0 评论 -
【图解】梯度下降
参考文章:http://blog.csdn.net/zhulf0804/article/details/52250220如果读者对方向导数和梯度的定义不太了解,请先阅读上篇文章《方向导数与梯度》。 前些时间接触了机器学习,发现梯度下降法是机器学习里比较基础又比较重要的一个求最小值的算法。梯度下降算法过程如下:1)随机初始值;2)迭代,直至收敛。表示在处的转载 2017-11-05 11:01:16 · 8095 阅读 · 5 评论 -
【图解】ROC曲线
参考文章:http://blog.csdn.net/l18930738887/article/details/46681597http://blog.csdn.net/u010159842/article/details/49562885待补充...曲线及部分应用,如有任何问题或错误欢迎各位留言~~一、随机选取用户营销的解释(随机线)原创 2017-11-05 19:51:51 · 1976 阅读 · 0 评论 -
【总结】分类、聚类的评估指标
1. 分类问题评价指标1-1. 精确率与召回率精确率(Precision)指的是模型判为正的所有样本中有多少是真正的正样本;召回率(Recall)指的是所有正样本有多少被模型判为正样本,即召回。感觉精确率是个局部的,召回率是个全局的。精确率与召回率1-2. ROC真正类率(true positive rate ,TPR),刻画的是分类器所识别出的 正实例占所有正实例的比例(正样本预测原创 2017-11-05 19:56:01 · 11182 阅读 · 0 评论 -
奇异值分解 VS 特征值分解
未完,待续...原创 2017-11-05 20:23:09 · 1056 阅读 · 0 评论 -
【Python数据预处理】 归一化(按列减均值,除方差),标准化(按列缩放到指定范围),正则化(范数)
参考文章:https://www.cnblogs.com/chaosimple/p/4153167.html一、标准化(Z-Score),或者去除均值和方差缩放公式为:(X-mean)/std 计算时对每个属性/每列分别进行。将数据按期属性(按列进行)减去其均值,并处以其方差。得到的结果是,对于每个属性/每列来说所有数据都聚集在0附近,方差为1。实现时,有两种不同的方式: ...原创 2018-11-06 08:32:57 · 29195 阅读 · 3 评论 -
【简明表】MATLAB + 矩阵运算
原创 2019-01-08 06:24:49 · 797 阅读 · 1 评论