自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

原创 t-SNE和主成分分析

降维,什么是降维,简单说就是将多个特征字段用少数的特征字段来表示,方便对数据的后续分析以及进行2维和3维的可视化。降维的方法有多种,主成分分析、主因子分析、随机森林、决策树、LASSO回归以及t-SNE等,其实降维可以理解成对变量的一种选择。本文不对所有的方法进行介绍,主要介绍一下主成分分析和t-SNE这两种方法。  首先,先介绍主成分分析(PCA),主成分分析的基本思想是研究如何通过原来变

2017-05-12 15:13:26 6448

原创 《天才在左,疯子在右》读书随笔

看书的名字以为这本书就是简单的介绍疯子的,实际的目的,作者希望读者通过阅读这本书,可以通过拨开文字和表象的迷雾,更开阔地接触这奇妙世界的本质。作者希望读者通过阅读这本书后,能有自己的想法和思考。“有自己的思想很重要,甚至可以说,这个比什么都重要”。   作者本文记录的疯子都有异于常人的能力和智慧,可是他们的思维方式的偏激,最终天才和疯子就是一线之隔。说实话,本书很多的故事我没有看懂,很多

2017-05-03 10:51:45 904

原创 数据挖掘导论读书笔记

本文主要对相关系数做出介绍,了解各种相似性和相异性度量的方法,以及适用的场景,以后该方法的优缺点。一、 数据类型  首先进行数据的类型进行介绍:在统计学上,将数据分为定性和定量两种类型。定量数据表示事物的数量或者个数,用数值标度度量。例如:转账的金额1000/次,转账的笔数2次/月。定性数据是指的没有量的解释,它们只能分类,例如:性别,职业,学历等。因为用来描述和分析数据的合适的统计

2017-04-18 08:51:32 938

原创 基于Python的线性回归实战

本文主要运用Python进行简单的线性回归,首先是介绍了线性回归的基本理论,然后是运用一些网络爬虫数据进行回归分析。一、线性回归的理论1)线性回归的基本概念线性回归是一种有监督的学习算法,它介绍的自变量的和因变量的之间的线性的相关关系,分为一元线性回归和多元的线性回归。一元线性回归是一个自变量和一个因变量间的回归,可以看成是多远线性回归的特例。线性回归可以用来预测和分类,从回归方程可以看出自变量和

2017-04-10 11:54:36 18538 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除