- 博客(6)
- 收藏
- 关注
原创 DeepLearning之RNN和LSTM详解及实现
RNN1. 什么是RNNs RNNs的目的使用来处理序列数据。在传统的神经网络模型中,是从输入层到隐含层再到输出层,层与层之间是全连接的,每层之间的节点是无连接的。但是这种普通的神经网络对于很多问题却无能无力。例如,你要预测句子的下一个单词是什么,一般需要用到前面的单词,因为一个句子中前后单词并不是独立的。RNNs之所以称为循环神经网路,即一个序列当前的输出与前面的输出也有关。具体的表现形式为网
2017-02-28 14:29:05 29224
转载 CART与ID3的区别&C4.5离散化的过程
一、CART与ID3的区别 通过之前的研究发现,CART与ID3算法都是基于信息论的决策树算法,CART算法是一种通过计算Diversity(整体)-diversity(左节点)-diversity(右节点)的值取最佳分割的算法。ID3和CART算法的区别主要集中在树的生成和树的修剪方面,但是ID3算法只能处理离散型的描述性属性。C4.5算法是ID3算法的后续算法,它能够处理连续型数据。
2017-02-15 16:31:24 3411
原创 numpy.cov以及corrcoef
协方差的定义: Cov(X,Y)=E[(X-E(X))(Y-E(Y))]#Estimate a covariance matrix, given data and weights.给定数据和权重,求解协方差矩阵# Covariance indicates the level to which two variables vary together. If we examine N-dimens
2017-02-15 11:01:55 7336
转载 数据清洗实例分析
一.数据清洗工作数据清洗:如填充缺失数据、消除噪声数据等,主要是通过分析“脏数据”的产生原因和存在形式,利用现有的数据挖掘手段和方法去清洗“脏数据”,将“脏数据”转化为满足数据质量要求或应用要求的数据,从而提高数据集的质量,满足现阶段数据分析的需求。DataEye数据清洗流程如下图: DataEye数据清洗方案及实践案例(一)噪声数据(异常值)清洗1.利用数据分布特征及箱
2017-02-05 10:54:18 17093 2
原创 Adaboost算法
AdaBoost是一种“集成方法”,通过将同一个弱分类器串行训练后,得到一个强分类器,进而实现较高精度的分辨能力。算法流程:假定给定一个二元分类的训练数据集 T={(x1,y1),(x2,y2),...(xN,yN)} T=\{ (x_1,y_1),(x_2,y_2),...(x_N,y_N)\} \ 其中,y∈{−1,1}y\in\{-1,1\}初始化训练数据的权值分布
2017-02-04 15:04:14 448
原创 Numpy入门
1.ndarray对象创建>>> a = np.array([1, 2, 3, 4])>>> b = np.array((5, 6, 7, 8))>>> c = np.array([[1, 2, 3, 4],[4, 5, 6, 7], [7, 8, 9, 10]])>>> barray([5, 6, 7, 8])>>> carray([[1, 2, 3, 4], [4,
2017-02-01 15:00:18 372
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人