- 博客(11)
- 收藏
- 关注
原创 pandas库的使用——用于数据清洗、表格文件存取
简介pandas是基于numpy的库,一维数据用Series,二维数据用DataFrame,以下所有例子都基于#基本操作一维初始化及按行索引a=Series([1,2,3])#默认索引从0开始b=Series([1,2,3],index=['a','b','c'])#可设置索引c=Series({'a':1,'b':2,'c':3})#可结合字典# print(c.keys...
2019-01-23 17:46:53 474
原创 20180325NN&DL(抑制过拟合)
1.神经元饱和 如果输出神经元是低激活或者高激活(激活在接近0或者1时),那么最后一层中的权重将学习得很慢,这种情况就是输出神经元饱和了,权重停止学习或者学习得很慢。有篇文章讲的是不同的激活函数的饱和问题:https://blog.csdn.net/margretwg/article/details/676349772.交叉熵 熵是一种不确定性的一种度量,如果得到的结果和...
2019-01-22 16:10:54 205
原创 数据集的拆分
零、概念分层采样:保留类别比例的采样 一、留出法 拆成两个互斥的集合,一个训练集S,一个测试集T缺点:T小时评估结果不够稳定准确;S小时,训练时的数据S与S+D差别较大,训练出来的模型与用S+D训练出来的模型差别较大,降低了评估结果的保真性 二、交叉验证法k折交叉验证的k个测试结果取平均作为最终结果 留一法是对m个样本进行m折的特例,优点是不用考虑分层采样...
2019-01-22 16:00:32 1600
原创 GAN、CGAN、DCGAN、Cycle GAN、SAGAN、WGAN、StarGAN
GAN:值函数(评价函数,非损失函数):x表示真实图片,z表示输入噪声,x~Pdata(x)与x~Pz(z)表示满足各自的分布律。理想状态下,D(G(Z))=0.5更新方式:交替训练G(Generator)和D(Discriminator), D加梯度,G减梯度简单讲一下上面两个公式,m指样本个数,从评价函数出发:第一个公式,更新的是D的w()第二个...
2019-01-21 21:10:54 3604 6
原创 爬虫(二)——使用多线程的方式爬取新版CSDN博客的总访问量
一.背景描述 在访问量上1万+后就看不到具体的访问数了,为了获得总访问数可以将各篇博客的访问数加起来,为了实现这个步骤的自动化,使用了爬虫的方法,怎么爬csdn的博客访问量可以参考以下博客,在此不赘述。 https://blog.csdn.net/u011031257/article/details/80931165 在爬取的时候发现了两个问题:1)如果只是单纯的...
2019-01-07 14:45:56 252
原创 数据可视化——基于matplotlib库
以下示例都基于进行了import操作import matplotlib.pyplot as plt 常用函数plt.plot(x,y,, color='green', marker='o', linestyle='dashed', linewidth=2, markersize=12,alpha=0.2,label='line')参数:自变量,因变量,颜色,点样式,线类型,线宽...
2019-01-04 22:40:13 359
原创 tensorflow(七)——基于RNN、LSTM进行正弦函数sin预测
一、基础知识RNN:存储了隐藏层的输出作为下一次的输入,网络具有时序信息双向RNN:正向反向传递上一层的记忆,组合形成输出从RNN到LSTM:RNN存在梯度消失,梯度爆炸的现象,所以对记忆体的存储更新做了修改,原来RNN是无限制更新记忆体的值,而LSTM对记忆体的存入,取出以及保存都通过门来限制。梯度消失、梯度爆炸:是由反向传播链式求导法则中的连乘导致的,导数\权重初始化\...
2019-01-04 20:09:36 1723
原创 tensorflow(六)——基于VGG19网络的特征可视化、图像识别
一、相关下载资料vgg的mat文件(存储了训练得到的值):http://www.vlfeat.org/matconvnet/models/beta16/imagenet-vgg-verydeep-19.matimagenet_classes.py(vgg输出层为全连层1000,做了1k类的分类):http://www.cs.toronto.edu/~frossard/post/vgg16/...
2019-01-03 21:51:00 7309 4
原创 tensorflow(五)——VGG16网络
零、CNN常用命令卷积 tf.nn.conv2d(input[batch,h,w,c],filter[h,w,c,out],strides=[1,h,w,1],padding='SAME'/'VALID',use_cudnn_on_gpu=None,data_format=None,name=None)有关参数详细说明,见:https://blog.csdn.net/xierhacke...
2019-01-03 16:38:04 2023
原创 爬虫(一)基础
浏览器到网站服务器响应爬虫就是用代码替代里浏览器,并对返回的信息进行解析伪装UAUA(User-Agent)在信息头中用于对请求的身份进行识别,某些网站为防止崩溃,会对机器人进行限制。比如发现是个python请求就直接拒绝了。step1)获取浏览器UA任意网页右键》》审查元素》》Network》》刷新/保存等任意操作》》Name中选中后任意请求》》Headers 'Requ...
2019-01-01 17:33:01 542
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人