自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

AnFany

机器学习、Codility、算法、Kaggle竞赛、深度学习、LeetCode

  • 博客(11)
  • 资源 (12)
  • 收藏
  • 关注

原创 Python3机器学习实战——原理、代码、实例集锦

为机器学习的入门者提供多种基于实例的sklearn、TensorFlow以及自编函数(AnFany)的ML算法程序。只要数据格式和例子的中的一样,程序可灵活调用

2018-12-28 10:20:12 7186

原创 Python3机器学习实践:集成学习之AdaBoost

一、AdaBoost初识这个方法主要涉及到2种权重:样本权重:每个样本都对应一个权重。在构建第一个弱模型之前,所有训练样本的权重是一样的。第一个模型完成后,要加大那些被这个模型错误分类(分类问题)、或者预测值与真实值的差值较大(回归问题)的样本的权重。依次迭代,最终构建多个弱模型。每个弱模型所对应的训练数据集样本是一样的,只是样本权重是不一样的。弱模型权重:得到的每个弱模型都对应一个权重。...

2018-12-29 09:59:04 311

原创 Python3机器学习实践:集成学习之随机森林

随机森林步骤:构建多个数据集在包括N个样本的数据集中,采用有放回的抽样方式选择N个样本,构成中间数据集,然后在这个中间数据集的所有特征中随机选择几个特征,作为最终的数据集。以上述方式构建多个数据集;一般回归问题选用全部特征,分类问题选择全部特征个数的平方根个特征为每个数据集建立完全分裂的决策树利用CART为每个数据集建立一个完全分裂、没有经过剪枝的决策树,最终得到多棵CART决策...

2018-12-29 09:57:51 540

原创 Python3机器学习实践:决策树CART

决策树主要包括ID3,C4.5以及CART。下面给出三种算法的说明:CART首先看下面表格中的示例数据(随机生成,仅供参考)。其中年龄,身高,月收入为连续变量,学历,工作为离散变量。如果把动心视为目标变量,此问题为分类问题。如果把动心度视为目标变量,此问题为回归问题。CART的目的是生成一个类似下面这样的树:分类树或者回归树。叶子节点若为Y或者N,是分类树;若是数字,则为回...

2018-12-29 09:55:44 419

原创 Python3机器学习实践:支持向量机理论与实例

支持向量机属于监督式学习的方法,可实现分类以及回归。它是Corinna Cortes和Vapnik等于1995年首先提出的。算法优点在于具有完整的理论支持,可以得到全局最优解,并且可以解决非线性问题。缺点在于不适用于样本数较大的情况,另外针对非线性问题时核函数的选择,没有特别的依据。分类–引入如上图,平面内展示了二维数据样本,其中“+”号表示正例,“-”号表示负例。存在无数条分割线可以分...

2018-12-29 09:52:30 258

原创 Python3机器学习实践:BP神经网络理论与实例

符号说明神经网络的层数m,也就是包括一个输入层,m-2个隐层,一个输出层;输入层为I,其节点数等于单个样本的输入属性数N_i;隐层输出为Hh,h为1到m-2,每一个隐层的节点数为Nh;输出层为O,其节点数等于单个样本的输出属性数N_o;样本真实输出为R;层之间连接的权重为Wq,q为0到m-2,Wq矩阵的大小为(g, t), g为该隐层前一层的节点数,t为该隐层的节点数...

2018-12-29 09:50:15 866

原创 Python3机器学习实践:集成学习

这个时代,如果你觉得自己不够强,那就找几个人联合起来。集成学习亦如此。 集成学习是一种将几种机器学习模型组合成一个模型的元算法(meta-algorithm),以减小方差(例如:Bagging),偏差(例如:Boosting),或者改进预测(例如:Stacking、Blending)。集成方法分类串行集成方法:多个模型顺序生成。此方法是利用模型之间的依赖关系。算法可以通过提高被...

2018-12-29 09:47:49 445

原创 Python3机器学习实践:Kmeans++聚类【实例:啤酒聚类】

下面介绍Kmeans以及Kmeans++算法理论以及算法步骤:根据样本特征选择不同的距离公式,程序实例中采用欧几里得距离。下面分别给出Kmeans以及Kmeans++算法的步骤。Kmeans聚类算法的结果会因为初始的类别中心的不同差异很大,为了避免这个缺点,下面介绍对初始类别中心的选择进行了优化的Kmeans++聚类算法。下面给出基于AnFany以及Sklearn库的结果:...

2018-12-29 09:45:41 3638

原创 Python3机器学习实践:Softmax回归【实例:鸢尾花分类】

Softmax回归可看作逻辑回归的扩展,用于解决多分类问题。鸢尾花数据集是机器学习中比较常用的,数据集包含150条数据,共分为3类:setosa, versicolor, virginica,每类50条数据,每个数据包含4个属性,为萼片长度,萼片宽度,花瓣长度以及花瓣宽度。不同于逻辑回归,Softmax回归定义一条数据X1属于类别Yi的概率为P(Y=Yi|X1,Ai),其中Ai代表类别Yi的...

2018-12-29 09:43:03 3958

原创 Python3机器学习实践:逻辑回归【实例:心脏病预测】

逻辑回归的输出结果是判定二分类的,在实际问题中可用来解决二分类问题,当然也可利用多次的oneVSother来解决多分类问题。现在我们有270人的身体指标数据,包括年龄、性别、心率最大值、以及是否患有心脏病等数据。现在我们要利用逻辑回归来判断一个人是否患有心脏病。也就是根据逻辑回归的输出判定一条数据是类1,还是类0。本例中患心脏病为类0。逻辑回归最关键的就是理解Sigmoid函数,也称为Log...

2018-12-29 09:39:29 3697 3

原创 Python3机器学习实践:线性回归【实例:波士顿房价预测】

线性回归是机器学习中最基础的算法,它研究的是样本目标和特征变量之间是否存在线性关系。现在我们有506条有关波士顿房子的综合数据,包括房子的价格、房子所在区的犯罪率、黑人比例、高速公路条数等。每条数据就是一个样本,房价就是目标变量,其他数据可看作特征变量。线性回归的步骤:1,建立模型:确定目标和特征变量,建立方程其中Y代表目标(因变量),X为特征(自变量),W为需要计算的参数。数学符号便...

2018-12-29 09:35:07 4699

526种中国传统颜色:名称 RGB 16进制

五百二十六种中国风传统颜色,穿越千年的美,只为遇见你。

2023-05-05

384种故宫走出来的颜色:名称,RGB

翻阅近400种典籍,从十几万件故宫馆藏文物中,根据二十四节气,七十二物候,臻选了应时、应节、应色的96件故宫文物,梳理出完整的384种中国传统色。

2023-05-05

vgg16_weights_tf_dim_ordering_tf_kernels_notop.h5.zip

VGG16不含最后全连接层的模型参数文件,大小56.2M

2021-02-24

夏皮罗维尔克检验(Shapiro-Wilk test).docx

夏皮罗维尔克检验(Shapiro-Wilk test)的步骤原理以及python3实现的程序,判断是否是正态分布,

2020-06-30

AHP权重计算说明.pdf

层次分析法AHP权重计算步骤详细说明,包括层次单排序的一致性检验、层次总排序的一致性检验以及权重的计算。

2019-11-07

AHP方法计算权重.pdf

AHP层次分析法——一致性检验以及权重计算。层次单排序以及层次总排序一致性检验说明文档。详细,注意细节。文件最后到第二行应该是B3应该是B2。

2019-09-11

算法A文档(19.7.11).pdf

统计学算法A文档,详细介绍了算法A计算稳健均值与稳健标准差的步骤

2019-07-11

GRADS单时次站点插值图 源代码Fortran

GRADS单时次站点插值图,比较完整、详细的源码流程。一步步制作插值图。 1利用Fortran将站点数据转变为Grads识别的二进制数据 2编写Grads识别的站点数据的ctl文件 3利用Fortran编写格点的数据文件 4编写Grads识别的格点数据的ctl文件 5利用Meteoinfo制作mask文件 6插值图Grads代码

2019-01-15

Stacking代码

利用Stacking针对北京市pm2.5数据进行回归预测,直接运行

2018-12-29

EPA PMF用户指导说明书

EPA PMF 用户指导说明书,内容详尽,不可多得的一本书籍

2018-11-28

确定标准测量方法精密度的可替代方法.

GBT 6379.5-2006 测量方法与结果的准确度(正确度与精密度) 第5部分:确定标准测量方法精密度的可替代方法

2018-11-13

统计学 迭代法

不可多得的迭代法说明,介绍了迭代法的算法步骤,详细

2018-07-27

PMF中文说明

PMF中文翻译,不可多得好资源,源解析模型,从理论到实践

2018-05-18

Growing Self-Organizing Mapping 超经典论文

自生长自组织映射 最经典的论文 没有之一。伪代码

2017-04-12

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除