自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(8)
  • 收藏
  • 关注

原创 最强降维模型t-SNE vs 最常用降维模型PCA(下)

异常点检测前文讲到tsne在高维度数据有着绝对的优势,能够碾压其余降维模型,在低维度的数据也毫不逊色任何一种。但是缺点也很明显,性能的代价往往是时间,它的时间复杂度过高。tsne降维完分块的特点很明显,但也有一些飘来飘去的点,这些点叫做异常点,异常点的剔除在日常生活中非常常见。比如机器零件的异常,食品,饮料等部分指标异常等。t-SNE和PCA降维后都有异常点,我们试着来分析分析,这些异常点如何检测以及通过这些点来判断降维的效果。常见的检测异常点有4种异常点检测方法,One-Class SVM(一分类

2020-05-25 22:58:36 1961 2

原创 最强降维模型t-SNE vs 最常用降维模型PCA(上)

t-SNE vs PCA背景概述实战总结由于原理较枯燥以及博主水平有限,故本文直接开始实战,需要补原理的读者还请谅解。背景概述假设你有一个包含数百个特征的数据集,却对该数据所属领域几乎没有什么了解,并且你需要去探索数据中存在的隐模式。那可谓是数无形时少直觉,根本无从下手,当数据各特征间存在高度的线性相关,这时你可能首先会想到使用 [公式] 对数据进行降维处理,但是PCA 是一种线性算法,它不能解释特征之间的复杂多项式关系,而t-SNE (t-distributed stochastic neighbo

2020-05-25 22:12:18 5632 6

原创 初学者对LSTM的理解

LSTM从RNN说起普通RNNLSTM四个状态在LSTM内部的使用本文借鉴和参考了许多文章,但忘记录了,如果侵权,请联系我,我将立马删除。从RNN说起循环神经网络(Recurrent Neural Network,RNN)是一种用于处理序列数据的神经网络。相比一般的神经网络来说,他能够处理序列变化的数据。比如某个单词的意思会因为上文提到的内容不同而有不同的含义,RNN就能够很好地解决这类问题。普通RNN先简单介绍一下一般的RNN。其主要形式如下图所示(图片均来自台大李宏毅教授的PPT):图源

2020-05-20 20:16:10 1700 1

原创 基于LSTM的股票时间序列预测(附数据集和代码)

LSTM数据集实战如果对LSTM原理不懂得小伙伴可以看博主下一篇博客,因为博主水平有限,结合其他文章尽量把原理写的清楚些。数据集首先附上数据集链接:https://pan.baidu.com/s/1AKsz-ohmYHr9mBEEh76P5g提取码:6owv这个数据集是关于股票的,里面有日期,开盘价等信息。既然是时间序列预测,我们最关心的是预测值在时间维度上的走势如何,那我们只要最后一列volume和第一列date这两列就好了。实战先是导入相关包,一些常见的包就不详细说了,我们需要的Se

2020-05-20 20:04:01 63945 94

原创 适合小白的keras搭建VGG-16

上次博主研究vgg16是直接调用已经训练好的vgg模型,没有自己进行搭建网络,这次博主先是用了tensorflow搭建,后来又用了keras搭建,发现keras对新手太友好了。首先附上vgg16的构建代码。想看实战项目的可以在博主的第二篇博文查看vgg16实战。vgg16先卷积2次,池化,卷积2次,池化,卷积3次,池化,卷积3次,池化,然后全连接层。看看大概结构其实很容易发现规律,似乎有些代码都是重复的,然后有些只是改个数字而已。具体怎么写,下面进行详细介绍。小伙伴们要特别注意代码中一些数字和上图结构

2020-05-14 00:04:30 3656 7

原创 TensorFlow之重要概念的基础操作

重要概念GraphSession创建关闭注入机制指定设备TensorOperationFeedFetchtensorflow为什么要这样取名,tensor:张量,flow:流动。在我们的tensorflow里面,变量就是张量,张量在不断的流动。其实就相当于我们日常生活中的流程图一般。这就引申出Graph这个概念。Graph图描述了计算的过程,可以通过tensorboard图形化流程结构。我们看到上面这个图,我们暂且称为流程图吧,流程图先是a+b=d,a*b=c,然后d+c=e。很简单的一个流程。对

2020-05-13 14:31:49 514 1

原创 决策树可视化:鸢尾花数据集分类(附代码数据集)

决策树数据集实战可视化评价决策树是什么?决策树(decision tree)是一种基本的分类与回归方法。举个通俗易懂的例子,流程图就是一种决策树。有没有车,没车的话有没有房,没房的话有没有存款,没存款pass。这个流程就是一个简单的决策树。分类决策树模型是一种描述对实例进行分类的树形结构。通过很多次判断来决定是否符合某类的特征。数据集首先附上数据集:链接:https://pan.bai...

2020-05-08 13:16:55 19217 3

原创 Python:三维空间的概率密度函数(附代码数据集)

二维高斯分布概率密度函数数据集实战优化坐标轴与图像优化图像再次优化概率密度函数大家肯定都有听说过正态分布,其实正态分布只是概率密度分布的一种,正态分布的概率密度函数均值为μ ,标准差σ是高斯函数的一个实例:f(x;μ,σ)=1σ2πexp⁡(−(x−μ)22σ2)f(x ; \mu, \sigma)=\frac{1}{\sigma \sqrt{2 \pi}} \exp \left(-\fr...

2020-05-07 19:18:05 9238 2

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除