roguesir的博客

ML、DM、DL

博客目录

更新日期:2018/05/02 R语言学习笔记 简介:R机器学习算法实现 Python学习笔记 简介:Python基础、数据结构、常用模块、Matplotlib画图、scikit-learn机器学习 Machine Learning算法学习 简介:方法技巧、异同总结、ML...

2018-04-24 17:52:17

阅读数:318

评论数:2

Paper-Reading(更新中)

更新时间:2018/05/07 前言 从开始接触数据挖掘、机器学习、深度学习,到现在读了不少论文,以后会整理出来放在这篇博客里,另会放在我的GitHub上面,这段时间比较忙,更新频率不会特别快~ Github链接:https://github.com/roguesi...

2018-03-20 19:50:35

阅读数:348

评论数:0

Resource-Sharing(更新中)

更新时间:2018/04/25 前言 从开始接触数据挖掘、机器学习、深度学习,到现在积累了不少资料,一点点整理分享出来,书和论文会放在百度云盘里,有需要的自己下载哈!这段时间比较忙,更新频率不会特别快~ Github链接:https://github.com/roguesir ,欢迎Fo...

2018-03-17 23:51:25

阅读数:293

评论数:0

LeetCode目录

最近开始刷LeetCode,我主要是用Python,把一些code记录在这里,陆续更新博客~ 更新时间:2019-01-21

2019-01-21 13:49:07

阅读数:1

评论数:0

【模型详解】AutoEncoder详解(七)——栈式自编码:Stacked AutoEncoder

前言 之前介绍了AutoEncoder及其几种拓展结构,如DAE,CAE等,本篇博客介绍栈式自编码器。 模型介绍 普通的AE模型通过多层编码解码过程,得到输出,最小化输入输出的差异从而使模型学到有用的特征。但是这种AE结构又一个弊端:虽然经过了多次的特征提取,但对于目标函数的计算只有一次,那么,如...

2018-12-05 20:59:06

阅读数:151

评论数:0

【模型详解】AutoEncoder详解(六)——Contractive AutoEncoder

paper: 摘要 本文提出了一种新的AE模型,能够更有效地获得鲁棒特征 介绍 如何提取鲁棒特征 Jacobian矩阵是多维 f(x)f(x)f(x) 的一阶偏导,表示形式如下: (1)∣∣Jf(x)∣∣F2=∑ij(∂hj(x)∂xi)2||J_f(x)||^2_F=\sum_{ij}(\fr...

2018-12-05 16:35:07

阅读数:142

评论数:0

【Redis学习笔记三】慢查询、pipeline、发布订阅、Bitmap、HyperLogLog、GEO

目录 慢查询 pipeline 发布订阅 Bitmap HyperLogLog GEO 慢查询 生命周期 发送命令 --> 排队 --> 执行命令 --> 返回结果 说明: 1.慢查询发生在第三阶段 2.客户端超时不一定有...

2018-10-27 22:17:50

阅读数:119

评论数:0

【PySpark学习笔记三】spark-submit命令详解

spark-submit命令利用可重用的模块形式编写脚本,并且以编程方式提交作业到Spark。 spark-submit命令 spark-submit命令提供一个统一的API把应用程序部署到各种Spark支持的集群管理器上,从而免除了单独配置每个应用程序。 命令行参数 下面逐个介绍这些参数...

2018-10-23 22:52:44

阅读数:344

评论数:0

博客目录——PySpark学习笔记

【PySpark学习笔记一】弹性分布式数据集RDD 【PySpark学习笔记二】DataFrame用法

2018-10-23 20:13:50

阅读数:154

评论数:0

【Redis学习笔记二】Redis客户端

Java客户端:Jedis Jedis基本使用 string jedis.set("hello", "world"); //[Out]: OK ...

2018-10-23 20:10:22

阅读数:98

评论数:0

博客目录——Redis学习笔记

【Redis学习笔记】Redis笔记(一)——特点、基础命令和数据结构 【Redis学习笔记】Redis笔记(二)——Redis客户端

2018-10-23 20:08:34

阅读数:103

评论数:0

【PySpark学习笔记二】DataFrame用法

DataFrame是一种不可变的分布式数据集。Spark早期的API中,由于JVM和Py4J之间的通信开销,使用Python执行查询会明显变慢。 Python到RDD之间的通信 在PySpark驱动器中,Spark Context通过Py4J启动一个JavaSparkContext的JVM,所...

2018-10-23 19:56:18

阅读数:115

评论数:0

【PySpark学习笔记一】弹性分布式数据集RDD

RDD的内部运行方式 Spark优势:每个转换操作并行执行,大大提高速度。 数据集的转换通常是惰性的,即在transformation过程不会执行程序,只有在action过程才会执行。 创建RDD 导入相关程序库 from pyspark import SparkContext as s...

2018-10-16 22:50:07

阅读数:115

评论数:0

【Redis学习笔记一】Redis特点、基础命令和数据结构

Redis的特性 速度快 持久化(断电不丢数据) 多种数据结构 支持多种客户端语言 功能丰富 操作简单 主从复制 高可用,分布式 Redis的通用命令 keys:计算键 key * # 遍历所有key keys命令支持正则匹配,如keys h*表示便利店以h...

2018-10-13 14:41:24

阅读数:185

评论数:0

Mac实现ts文件转为mp4文件

ts文件将视频文件切分成多块,本篇博客介绍在Mac上实现ts文件转为mp4文件,只需几步,方便实用。 合并ts文件 打开Terminal,进入相关文件夹,执行: cat *.ts > x.ts 安装ffmpeg 执行下面命令: brew install f...

2018-09-02 00:26:10

阅读数:1929

评论数:1

Git多账号管理

Git多账号管理 工作代码需要上传企业gitlab,个人还有一个GitHub账号,之前有设置git config --global,避免两个git账号信息混乱,可以在新建的文件下执行: git config --local user.name xxx git config --local ...

2018-08-29 15:19:56

阅读数:167

评论数:0

【Linux学习笔记】Linux命令压缩解压文件

# .tar格式 #解包 tar xvf FileName.tar #打包 tar cvf FileName.tar DirName #.gz格式 #解压1 gunzip FileName.gz #解压2 gzip -d FileName.gz #压缩 gzip FileName #.tar....

2018-08-16 10:20:38

阅读数:131

评论数:0

【ML算法】集成学习——LightGBM的Python实现

前言 LightGBM算法作为Kaggle竞赛的热门算法,具有速度快、精度高、可并行等特点,本文实现了LightGBM算法的简单实现。 代码 # coding: utf-8 import json import lightgbm as lgb import pandas as pd from...

2018-08-10 15:23:43

阅读数:606

评论数:0

【DL笔记】Tutorial on Variational AutoEncoder——中文版(更新中)

摘要 近三年来,变分自编码(VAE)作为一种无监督学习复杂分布的方法受到人们关注,VAE因其基于标准函数近似(神经网络)而吸引人,并且可以通过随机梯度下降进行训练。VAE已经在许多生成复杂数据包括手写字体[1,2]、人脸图像[1,3,4]、住宅编码[5,6]、CIFAR图像[6]、物理模型场...

2018-07-31 20:13:10

阅读数:298

评论数:0

【DL笔记】Tutorial on Variational AutoEncoder——中英文对照(更新中)

Abstract In just three years, Variational Autoencoders (VAEs) have emerged as one of the most popular approaches to unsupervised learning ...

2018-07-31 20:03:47

阅读数:229

评论数:0

提示
确定要删除当前文章?
取消 删除
关闭
关闭