- 博客(4)
- 收藏
- 关注
原创 t-SNE和主成分分析
降维,什么是降维,简单说就是将多个特征字段用少数的特征字段来表示,方便对数据的后续分析以及进行2维和3维的可视化。降维的方法有多种,主成分分析、主因子分析、随机森林、决策树、LASSO回归以及t-SNE等,其实降维可以理解成对变量的一种选择。本文不对所有的方法进行介绍,主要介绍一下主成分分析和t-SNE这两种方法。 首先,先介绍主成分分析(PCA),主成分分析的基本思想是研究如何通过原来变
2017-05-12 15:13:26 6448
原创 《天才在左,疯子在右》读书随笔
看书的名字以为这本书就是简单的介绍疯子的,实际的目的,作者希望读者通过阅读这本书,可以通过拨开文字和表象的迷雾,更开阔地接触这奇妙世界的本质。作者希望读者通过阅读这本书后,能有自己的想法和思考。“有自己的思想很重要,甚至可以说,这个比什么都重要”。 作者本文记录的疯子都有异于常人的能力和智慧,可是他们的思维方式的偏激,最终天才和疯子就是一线之隔。说实话,本书很多的故事我没有看懂,很多
2017-05-03 10:51:45 904
原创 数据挖掘导论读书笔记
本文主要对相关系数做出介绍,了解各种相似性和相异性度量的方法,以及适用的场景,以后该方法的优缺点。一、 数据类型 首先进行数据的类型进行介绍:在统计学上,将数据分为定性和定量两种类型。定量数据表示事物的数量或者个数,用数值标度度量。例如:转账的金额1000/次,转账的笔数2次/月。定性数据是指的没有量的解释,它们只能分类,例如:性别,职业,学历等。因为用来描述和分析数据的合适的统计
2017-04-18 08:51:32 938
原创 基于Python的线性回归实战
本文主要运用Python进行简单的线性回归,首先是介绍了线性回归的基本理论,然后是运用一些网络爬虫数据进行回归分析。一、线性回归的理论1)线性回归的基本概念线性回归是一种有监督的学习算法,它介绍的自变量的和因变量的之间的线性的相关关系,分为一元线性回归和多元的线性回归。一元线性回归是一个自变量和一个因变量间的回归,可以看成是多远线性回归的特例。线性回归可以用来预测和分类,从回归方程可以看出自变量和
2017-04-10 11:54:36 18538 1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人