2019年01月_北落师门XY

原创 pandas库的使用——用于数据清洗、表格文件存取

简介pandas是基于numpy的库，一维数据用Series，二维数据用DataFrame，以下所有例子都基于#基本操作一维初始化及按行索引a=Series([1,2,3])#默认索引从0开始b=Series([1,2,3],index=['a','b','c'])#可设置索引c=Series({'a':1,'b':2,'c':3})#可结合字典# print(c.keys...

2019-01-23 17:46:53 474

原创 20180325NN&DL（抑制过拟合）

1.神经元饱和如果输出神经元是低激活或者高激活（激活在接近0或者1时），那么最后一层中的权重将学习得很慢，这种情况就是输出神经元饱和了，权重停止学习或者学习得很慢。有篇文章讲的是不同的激活函数的饱和问题：https://blog.csdn.net/margretwg/article/details/676349772.交叉熵熵是一种不确定性的一种度量，如果得到的结果和...

2019-01-22 16:10:54 205

原创数据集的拆分

零、概念分层采样：保留类别比例的采样一、留出法拆成两个互斥的集合，一个训练集S，一个测试集T缺点：T小时评估结果不够稳定准确；S小时，训练时的数据S与S+D差别较大，训练出来的模型与用S+D训练出来的模型差别较大，降低了评估结果的保真性二、交叉验证法k折交叉验证的k个测试结果取平均作为最终结果留一法是对m个样本进行m折的特例，优点是不用考虑分层采样...

2019-01-22 16:00:32 1600

转载 linux（四）——文本处理器vim

插入命令定位命令替换和取消命令删除命令常用快捷键

2019-01-22 15:59:30 119

原创 GAN、CGAN、DCGAN、Cycle GAN、SAGAN、WGAN、StarGAN

GAN：值函数（评价函数，非损失函数）：x表示真实图片，z表示输入噪声，x~Pdata(x)与x~Pz(z)表示满足各自的分布律。理想状态下，D（G（Z））=0.5更新方式：交替训练G（Generator）和D(Discriminator), D加梯度，G减梯度简单讲一下上面两个公式，m指样本个数，从评价函数出发：第一个公式，更新的是D的w（）第二个...

2019-01-21 21:10:54 3604 6

原创爬虫（二）——使用多线程的方式爬取新版CSDN博客的总访问量

一.背景描述在访问量上1万+后就看不到具体的访问数了，为了获得总访问数可以将各篇博客的访问数加起来，为了实现这个步骤的自动化，使用了爬虫的方法，怎么爬csdn的博客访问量可以参考以下博客，在此不赘述。 https://blog.csdn.net/u011031257/article/details/80931165 在爬取的时候发现了两个问题：1）如果只是单纯的...

2019-01-07 14:45:56 252

原创数据可视化——基于matplotlib库

以下示例都基于进行了import操作import matplotlib.pyplot as plt 常用函数plt.plot(x,y,, color='green', marker='o', linestyle='dashed', linewidth=2, markersize=12，alpha=0.2,label='line')参数：自变量，因变量，颜色,点样式，线类型，线宽...

2019-01-04 22:40:13 359

原创 tensorflow（七）——基于RNN、LSTM进行正弦函数sin预测

一、基础知识RNN：存储了隐藏层的输出作为下一次的输入，网络具有时序信息双向RNN:正向反向传递上一层的记忆，组合形成输出从RNN到LSTM：RNN存在梯度消失，梯度爆炸的现象，所以对记忆体的存储更新做了修改，原来RNN是无限制更新记忆体的值，而LSTM对记忆体的存入，取出以及保存都通过门来限制。梯度消失、梯度爆炸：是由反向传播链式求导法则中的连乘导致的，导数\权重初始化\...

2019-01-04 20:09:36 1723

原创 tensorflow（六）——基于VGG19网络的特征可视化、图像识别

一、相关下载资料vgg的mat文件（存储了训练得到的值）：http://www.vlfeat.org/matconvnet/models/beta16/imagenet-vgg-verydeep-19.matimagenet_classes.py（vgg输出层为全连层1000，做了1k类的分类）：http://www.cs.toronto.edu/~frossard/post/vgg16/...

2019-01-03 21:51:00 7309 4

原创 tensorflow（五）——VGG16网络

零、CNN常用命令卷积 tf.nn.conv2d(input[batch,h,w,c],filter[h,w,c,out],strides=[1,h,w,1],padding='SAME'/'VALID',use_cudnn_on_gpu=None,data_format=None,name=None)有关参数详细说明，见：https://blog.csdn.net/xierhacke...

2019-01-03 16:38:04 2023

原创爬虫（一）基础

浏览器到网站服务器响应爬虫就是用代码替代里浏览器，并对返回的信息进行解析伪装UAUA（User-Agent）在信息头中用于对请求的身份进行识别，某些网站为防止崩溃，会对机器人进行限制。比如发现是个python请求就直接拒绝了。step1）获取浏览器UA任意网页右键》》审查元素》》Network》》刷新/保存等任意操作》》Name中选中后任意请求》》Headers 'Requ...

2019-01-01 17:33:01 542

北落师门XY的博客