自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 收藏
  • 关注

原创 TSVD截断奇异值分解

从某种程度上来说,PCA和SVD是一对表亲,PCA对特征的协方差矩阵进行分解,找到一堆特征的线性组合,尽可能多的表示出原始特征中成分,SVD则对原始数据直接进行奇异值分解,找到原始数据中尽可能大的特征值,以这些特征值多对应的特征向量作为新的特征。本文在这里介绍一种正则化办法——截断奇异值分解技术(TSVD)。对于线性方程组,进行奇异值分解,得到则方程原本的解可写成截取前p项

2017-05-13 11:32:38 13572

原创 利用pandas高维作图

多维变量双散点矩阵图弹簧图并行维度图from sklearn import datasetsimport pandasfrom pandas.tools.plotting import scatter_matrixfrom matplotlib import pyplot# 以下三个为多变量可视化from pandas.tools.plotting import

2017-05-13 10:40:31 3260

原创 pandas操作

pandas知识回顾iloc/ix切片列条件与与列的筛选读取csv、xlsx文件行的增加与删除列的增加与删除排序数据分组描述统计描述作图数据框合并#-*-encoding:utf-8-*-'''created by zwg in 2016-12-03'''import pandasimport numpyfrom pylab import mplfrom matplotl

2017-05-13 10:34:05 601

原创 集成方法(随机森林)

随机森林是集成方法中优势非常强的一种方法,它以决策树为基础学习器,每棵树独立建立,天然具有并行特性,相对于GradientBoosting和Bagging方法而言,它耗内存更大,速度也相对慢些,但能获得更稳定的结果,尤其是在与CV验证相结合时,泛化能力大大增强。决策树基本算法随机森林算法应用随机森林1、决策树基本算法(1)寻找最优化分节点的办法有信息增益量和

2017-05-07 10:58:28 1689

原创 流形学习

经典流形学习:1、MDS2、ISOMAP3、LLE4、SpecturalEmbeding6、SNE系列MDS是在降维后保持样本之间的相对距离不变,ISOMAP对MDS进行改进,讲相对距离改成了测地线距离(机除了领域点之外,其他的之间距离都为无穷大,再通过最小路径求得这些距离无穷大的点间距离),LLE与ISOMAP思想类似,不过LLE绕了一个弯,它构建出高维空间中的领域点间线

2017-05-06 10:21:53 1036 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除