自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(9)
  • 资源 (1)
  • 问答 (2)
  • 收藏
  • 关注

原创 Pandas常用方法

数据处理很多需要用到pandas,有两个基本类型:Series表示一维数据,DataFrame表示多维。以下是一些常用方法的整理:pandas.Series创建 Seriespandas.Series( data, index, dtype, copy)namevaluedata数据采取各种形式,如:ndarray,list,dict, constants(常量)...

2019-11-03 17:40:17 888

原创 PCA降维的原理及实现

PCA可以将数据从原来的向量空间映射到新的空间中。由于每次选择的都是方差最大的方向,所以往往经过前几个维度的划分后,之后的数据排列都非常紧密了, 我们可以舍弃这些维度从而实现降维原理内积两个向量的乘积满足:ab=∣a∣⋅∣b∣⋅cos(θ)ab= |a|\cdot |b|\cdot cos(\theta)ab=∣a∣⋅∣b∣⋅cos(θ).如果∣b∣=1|b|=1∣b∣=1的话,ab=∣a...

2019-11-03 17:32:13 1672

原创 案例1-Digit-Recognizer

搬运来的步骤一. 数据分析下载并加载数据总体预览数据:了解每列数据的含义,数据的格式等数据初步分析,使用统计学与绘图: 由于特征没有特殊的含义,不需要过多的细致分析二. 特征工程1.根据业务,常识,以及第二步的数据分析构造特征工程.2.将特征转换为模型可以辨别的类型(如处理缺失值,处理文本进行等)三. 模型选择1.根据目标函数确定学习类型,是无监督学习还是监督学习,是分类问...

2019-11-03 17:31:39 233

原创 sklearn中的SVM

SVM真的是很复杂的算法,原本以为原理看懂了实现就会很简单,然而事实并不是这样sklearn中对于支持向量机提供了很多模型:LinearSVC, LinearSVR, NuSVC, NuSVR, SVC, SVR参数SVC用于分类,用libsvm实现,参数如下:C : 惩罚项,默认为1.0,C越大容错空间越小;C越小,容错空间越大kernel : 核函数的类型,可选参数为:“l...

2019-11-03 17:31:05 16736 3

原创 支持向量机公式整理(SVM)

支持向量机可以分为三类:线性可分的情况 ==> 硬间隔最大化 ==> 硬间隔SVM近似线性可分的情况 ==> 软间隔最大化 ==> 线性支持向量机线性不可分的情况 ==> 核技巧/软间隔最大化 ==> 非线性SVM硬间隔向量机(hard margin svm)任务:寻找一条与所有支持向量距离最远的决策边界,这条决策边界就是0=wTX+b0 = ...

2019-11-03 17:30:35 1973

原创 numpy备忘(2)

x.ravel() 和 x.flatten() : 将多为数组降维到1维.ravel()返回元素的引用(对象不一样,但是元素是引用),flatten()返回新的元素。np.meshgrid(x, y) : 返回两个矩阵(X,Y),由这两个矩阵可以将xy定义的空间中的所有点描述出来。所有的点就是网格中的一个个焦点。# 每次刷新一行的感觉axis = [-2, 2, -2, 2]x0, x1 ...

2019-11-03 17:28:30 118

原创 多项式回归 & pipeline & 学习曲线 & 交叉验证

多项式回归就是数据的分布不满足线性关系,而是二次曲线或者更高维度的曲线。此时只能使用多项式回归来拟合曲线。比如如下数据,使用线性函数来拟合就明显不合适了。接下来要做的就是升维,上面的真实函数是:$ y = 0.5x^2 + 2x + 5。而样本数据的形式是(x,y),以这种方式只能训练出。而样本数据的形式是(x, y),以这种方式只能训练出。而样本数据的形式是(x,y),以这种方式只能训练出...

2019-11-03 17:27:51 1744

原创 L1、L2-正则化

出现过拟合时,使用正则化可以将模型的拟合程度降低一点点,使曲线变得缓和。L1正则化(LASSO)正则项是所有参数的绝对值的和。正则化不包含theta0,因为他只是偏置,而不影响曲线的摆动幅度。J(θ)=MSE⁡(y,y^)+α∑i=1n∣θi∣J(\theta)=\operatorname{MSE}(y, \hat{y})+\alpha \sum_{i=1}^{n}\left|\theta...

2019-11-03 17:26:46 387

原创 三种梯度下降法的对比(BGD & SGD & MBGD)

常用的梯度下降法分为:批量梯度下降法(Batch Gradient Descent)随机梯度下降法(Stochastic Gradient Descent)小批量梯度下降法(Mini-Batch Gradient Descent)简单的算法示例数据x = np.random.uniform(-3,3,100)X = x.reshape(-1,1)y = x * 2 + 5 +...

2019-11-03 17:26:06 368

commons-fileupload-1.2.1.jar和commons-io-1.3.2.jar程序文件

commons-fileupload-1.2.1.jar和commons-io-1.3.2.jar commons-fileupload-1.2.1.jar和commons-io-1.3.2.jar程序文件

2017-09-13

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除