- 博客(5)
- 收藏
- 关注
原创 对深度学习卷积操作的理解
本文介绍对了对卷积核、滤波器、通道等概念的理解。二维卷积二维卷积就是卷积核(指的是一个小的权值矩阵)在二维输入数据上滑动遍历整张图片,对当前输入的部分元素进行矩阵乘法,将一个二维矩阵转换为另一个二维矩阵,然后将结果输出,输出特征实际上是在输入数据相同位置上的加权和。下图是一个标准的卷积: 从上面的描述可知,卷积核的尺寸直接决定了生成新的特征是汇合了多少个输入特征,在上图中,我们输入的...
2018-07-22 09:00:12 1523
原创 pyspark特征工程常用方法(一)
本文记录特征工程中常用的五种方法:MinMaxScaler,Normalization,OneHotEncoding,PCA以及QuantileDiscretizer 用于分箱 原有数据集如下图: 1. MinMaxScalerfrom pyspark.ml.feature import MinMaxScaler# 首先将c2列转换为vector的形式vecAssembler ...
2018-07-11 19:28:04 11240 2
原创 pyspark构建简单模型(RandomForest&LogisticRegression)
本文记录了用pyspark构建一个简单的模型的过程。1. 读取数据集from pyspark.sql import SparkSessionfrom pyspark.ml.feature import StringIndexerfrom pyspark.ml.classification import LogisticRegressionfrom pyspark.ml impor...
2018-07-11 05:29:24 4222
原创 图像篡改痕迹检测:Adobe双流Faster R-CNN网络
为了检测图像是否被篡改,Adobe在最近的论文中提出了一种双流Faster R-CNN网络,对图像进行端对端的训练,检测经过处理图像中被篡改的区域。 双流中的一个流是RGB流,用于从RGB图像输入中提取特征,通过对比度差异、不自然边界等找出篡改的痕迹。另一个流是噪声流,利用SRM(steganalysis rich model)模型的过滤层中提取噪声的特征,找出图像中真实区域和被篡改区域的噪声间...
2018-07-08 13:54:54 8343 1
原创 linux虚拟机中执行写好的pyspark程序
上一篇文章中已提到如何在linux中搭建pyspark环境,如果需要的同学请查看linux虚拟机搭建pyspark环境文章,本次主要讲解如何直接在环境中能够直接使用已写好的py文件直接运行。文件共享虚拟机和主机需要配置文件共享,首先将virtualbox安装增强工具,安装之前需要执行以下命令,提前安装好需要的程序yum updateyum install gccyum inst...
2018-07-01 23:54:38 2367
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人