miya_116-CSDN博客

转载 GBDT+LR融合算法及其python实现

本质上GBDT+LR是一种具有stacking思想的二分类器模型，所以可以用来解决二分类问题。这个方法出自于Facebook 2014年的论文Practical Lessons from Predicting Clicks on Ads at Facebook。参考地址...

2019-03-20 09:41:14 233

原创利用Pyhton画论文中的折线图

# encoding=utf-8import matplotlib.pyplot as pltfrom pylab import * #支持中文mpl.rcParams['font.sans-serif'] = ['SimHei']names = ['20', '25', '30', '35', '40','45']x ...

2019-02-26 12:23:56 458

转载 python describe()和corr()

1. data.describe() #基本统计量count 195.000000 #数量mean 2744.595385 #均值std 424.739407 #标准差min 865.000000 #最小值25% 2460.600000 #下四分位50% 2655.900000 #中位数75% 3023.200000 #上四分位max ...

2019-02-25 13:55:20 412

原创机器学习算法目录

梯度提升决策树GBDT 主成分分析法PCA 偏最小二乘法 kmeans聚类算法原理及其实现逻辑回归——logistics regression（对数几率回归）感知机模型SVM算法原理及其实现...

2019-02-24 14:27:50 120

原创 SVM算法原理及其实现

1.支持向量机支持向量机是一种二分类模型，SVM能构建出数据之间的非线性关系。svm的学习策略就是间隔最大化，学习一个线性分类器，可形式化为一个求凸二次规划的问题，也等价于正则化的合页损失函数最小化问题。SVM的学习算法是求解凸二次规划的最优化算法。支持向量机学习方法包含构建由简至繁的模型：线性可分支持向量机、线性支持向量机及非线性支持向量机。简单模型是复杂模型的基础，也是复杂模型的基础情...

2018-12-23 13:43:39 670

　感知机可以说是最古老的分类方法之一了，在1957年就已经提出。今天看来它的分类模型在大多数时候泛化能力不强，但是它的原理却值得好好研究。因为研究透了感知机模型，学习支持向量机的话会降低不少难度。同时如果研究透了感知机模型，再学习神经网络，深度学习，也是一个很好的起点。这里对感知机的原理做一个小结。1.感知机模型https://blog.csdn.net/havefun00/article/d...

2018-12-23 13:27:15 244

转载逻辑回归——logistics regression（对数几率回归）

原理代码实现参考对数几率回归 —— Logistic Regression经过学习整理逻辑回归伪代码如下：仅供个人学习使用

2018-12-05 15:36:35 278

转载 K-means聚类的算法原理及实现

原地址1、如何理解K-Means算法？2、如何寻找K值及初始质心？3、如何应用K-Means算法处理数据？K-means聚类的算法原理K-Means是聚类算法中的一种，其中K表示类别数，Means表示均值。顾名思义K-Means是一种通过均值对数据点进行聚类的算法。K-Means算法通过预先设定的K值及每个类别的初始质心对相似的数据点进行划分。并通过划分后的均值迭代优化获得最优的聚类结...

2018-11-24 16:07:24 1252

原创《基于深度学习的推荐系统研究综述》_黄立威——阅读笔记

一、常用的深度学习模型和方法介绍1.自编码器自编码器通过一个编码和一个解码过程来重构输入数据，学习数据的隐表示。基本的自编码器可视为一个三层的神经网络结构.下图是自编码器结构示意图：自编码器的目的是使得输入 x 与输出 y 尽可能接近，这种接近程度通过重构误差表示，根据数据的不同形式，通常重构误差有均方误差和交叉熵两种定义方式。如果仅仅通过最小化输入输出之间的误差来实现对模型的...

2018-08-11 19:56:35 5165 1

转载推荐系统学习（一）——协同过滤

一、协同过滤推荐算法的原理及实现见链接详细介绍 https://blog.csdn.net/yimingsilence/article/details/549343021.基于用户的协同过滤如上述链接例题未看懂看此例题：2.基于项目的协同过滤二、协同过滤推荐算法总结（很详细）三、推荐算法实战（召回率、准确率）...

2018-08-07 19:07:31 365

化学论文笔记（二）

四、《伏安型电子舌在食用油检测中的应用》1、研究的意义，食用油的质量问题直接影响人们的健康，地沟油事件猖狂2、通过检测电导率、过氧化酸价来检测食用油的好坏电导率低的食用油是好油（使用电导仪），过氧化酸价PH低的是好油（使用酸碱试纸），这两种方法只能检测食用油的好坏，比较单一3、模式识别方法1）典型的相关性分析计算相关系数矩阵，使用pearson指数对结果进行分析，pea...

2018-08-05 21:19:51 330

转载数据处理——偏最小二乘法

一、最小二乘法点击：最小二乘法概念及用python实现最小二乘法实例详细介绍版本二：https://wiki.klniu.com/zh-hans/Python/Modules/Scipy二乘法实例理解：https://blog.csdn.net/bitcarmanlee/article/details/51589143假设身高是变量X，体重是变量Y，我们都知道身高与体重有比较直...

2018-08-02 15:41:28 1852

原创文阳平教授化学学科论文阅读笔记（一）

一、《电子舌电化学特征参数的稳定性研究与应用》1. 三种常用的电化学分析方法：溶液等效电路分析、对称方波分析、计时库仑分析2.数据处理的方法（1）剔除异常值样本大于3倍的标准差剔除3.PCA DI值 CV值区分程度(DI值）用于表征智舌数据经过主成分分析后样品之间的区分效果和辨识能力。Cv值表示的是元件对介质的流通能力，即：流量系数。4.结果与分析4....

2018-07-11 21:33:47 649

原创主成分分析法（PCA）

一、数学基础1.方差：用来计算每一个变量（观察值）与总体均数之间的差异。总体方差计算公式：（为总体方差，为变量，为总体均值，为总体例数。）2.协方差：在概率论和统计学中，协方差用于衡量两个变量的总体误差。而方差是协方差的一种特殊情况，即当两个变量是相同的情况。期望值分别为E[X]与E[Y]的两个实随机变量X与Y之间的协方差Cov(X,Y)定义为：从直观上来看，协方差表示的...

2018-06-20 15:40:43 3165

转载梯度提升决策树GBDT

1.1 Gradient BoostingGradient Boosting是一种Boosting的方法，它主要的思想是，每一次建立模型是在之前建立模型损失函数的梯度下降方向。损失函数是评价模型性能（一般为拟合程度+正则项），认为损失函数越小，性能越好。而让损失函数持续下降，就能使得模型不断改性提升性能，其最好的方法就是使损失函数沿着梯度方向下降（讲道理梯度方向上下降最快）。Gradien...

2018-06-19 19:33:00 705

原创 ROC曲线分析

1.接收者操作特征曲线（receiver operating characteristic curve，或者叫ROC曲线）是一种座标图式的分析工具，用于选择最佳的信号侦测模型、舍弃次佳的模型，以及在同一模型中设定最佳阈值。ROC曲线是根据一系列不同的二分类方式（分界值或决定阈），以真阳性率（灵敏度）为纵坐标，假阳性率（1-特异度）为横坐标绘制的曲线。2.ROC曲线的意义：ROC曲线指受试者工作特征...

2018-06-19 16:22:46 2081

qq_38285573的博客