![](https://img-blog.csdnimg.cn/20201014180756780.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
机器学习
zhaoyuxia517
这个作者很懒,什么都没留下…
展开
-
用 Keras 编写你的第一个人工神经网络(Python)—— Jinkey 翻译
译者:Jinkey(微信公众号 jinkey-love)英文原版地址:点击跳转教程概述这里不需要编写太多的代码,不过我们将一步步慢慢地告诉你怎么以后怎么创建自己的模型。教程将会涵盖以下步骤:加载数据定义模型编译模型训练模型评估模型结合所有步骤在一起这个教程的前置条件:有 python 2 或 3 的环境和编程基础安装并配置好 Scipy 库(包括 N转载 2017-09-15 16:21:43 · 1178 阅读 · 1 评论 -
信息量,熵,相对熵,交叉熵
转自:http://blog.csdn.net/rtygbwwwerr/article/details/507780981.什么是信息量?假设X是一个离散型随机变量,其取值集合为X,概率分布函数为p(x)=Pr(X=x),x∈X,我们定义事件X=x0的信息量为:I(x0)=−log(p(x0)),可以理解为,一个事件发生的概率越大,则它所携带的信息量就越小,而当p(x0)=1时转载 2018-01-09 19:33:32 · 433 阅读 · 0 评论 -
集成算法系列之GBM
http://baijiahao.baidu.com/s?id=1570175598042474&wfr=spider&for=pc一、GBM简介GBM全称为Gradient Boosting Machine,是Boosting算法的一种。Boosting算法详见《集成算法系列之初识》。GBM主要思想是基于之前建立的基学习器的损失函数的梯度下降方向来建立下一个新的基学习器,目的就是希望转载 2017-12-07 10:20:21 · 4391 阅读 · 0 评论 -
标准机器学习数据集
学好机器学习的关键是用许多不同的数据集来练习。因为对不同的问题,需要有不同的数据准备和建模方法。本文介绍了10个更受欢迎的标准机器学习数据集,可以用作练习的资源。每个数据集均按照一定的格式介绍,以使读者相对容易比较,为他们的特定练习任务选择数据集或建模方法。格式:名称:如何引用数据集问题类型:是回归问题还是分类问题输入和输出:输入和输出特征的数量和名称性能:使用转载 2017-09-15 18:08:58 · 13207 阅读 · 1 评论 -
Scikit-learn 1.13.Feature selection
1.13.1 移除低方差的特征 VarianceThreshold方法布尔类型特征是Bernoulli随机变量,方差为:Var[X]=p(1-p)举例,阈值:.8*(1-.8)>>> from sklearn.feature_selection import VarianceThreshold>>> X = [[0, 0, 1], [0, 1, 0], [1, 0, 0], [0, 1, 1]翻译 2018-01-19 18:03:03 · 312 阅读 · 0 评论