自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 收藏
  • 关注

转载 数据预处理(数据清洗)的一般方法及python实现

数据预处理的一般方法及python实现这是一个大数据的时代。我们在很多时候都要处理各种各样的数据。但是并非所有数据都是拿来即可使用,都是要先经过一番处理后才能进行下一步操作。在我们爬到数据或者要处理一份数据文件时,首先要对数据进行清洗和除噪。本文就总结一下,一般数据预处理过程中可能要用到的方法。1.查找数据的缺失值在拿到第一份原始数据的时候,首先要检查数据的完整...

2019-01-28 15:47:00 1888

转载 机器学习关于集成算法的两种基本思想

集成算法bagging把训练集分为B个(可重复),即bootstrap数据集,然后分别求出其中的beta值然后进行加权平均。如果每个子集的错误都是独立的,这种方法就可以减小误差。Variance一定减小。在决策树方面,这种方法尤为有效。缺点是解释性降低。代表算法有random forest。boosting每一次的迭...

2018-12-04 11:19:00 406

转载 机器学习之神经网络及python实现

神经网络在机器学习中有很大的应用,甚至涉及到方方面面。本文主要是简单介绍一下神经网络的基本理论概念和推算。同时也会介绍一下神经网络在数据分类方面的应用。首先,当我们建立一个回归和分类模型的时候,无论是用最小二乘法(OLS)还是最大似然值(MLE)都用来使得残差达到最小。因此我们在建立模型的时候,都会有一个loss function。而在神经网络里也不例外,也有个类似的loss f...

2018-10-13 14:21:00 428

转载 金融时间序列及Matlab实现

数据处理一共可以分为三个方面,一是数据的回归分类,而是时间序列数据,三是网络型数据处理。本文将要来讨论一下时间序列的应用。一.ARMA 模型Arma是用来讨论时间序列里面回报率的情况,假设t时刻的回报率与t时刻之前的回报率有关。同时,也与之前的误差有关。这模型就是AR模型和MA模型的结合,非常好理解。我们在matlab中画出序列的ACF图和PACF图来找出具...

2018-08-05 18:01:00 2933

转载 数据回归分类预测的基本算法及python实现

数据回归分类预测的基本算法及python实现关于数据的回归和分类以及分析预测。讨论分析几种比较基础的算法,也可以算作是比较简单的机器学习算法。一. KNN算法邻近算法,可以用来做回归分析也可以用来做分类分析。主要思想是采取K个最为邻近的自变量来求取其应变量的平均值,从而做一个回归或者是分类。一般来说,K取值越大,output的var会更小,但bias相应会变大。...

2018-07-29 20:05:00 1055

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除