- 博客(233)
- 资源 (16)
- 收藏
- 关注
原创 Pytorch实现基于CharRNN的文本分类与生成
Pytorch实现基于CharRNN的文本分类与生成标签: deep-learning pytorch nlp1 简介本篇主要介绍使用pytorch实现基于CharRNN来进行文本分类与内容生成所需要的相关知识,并最。2 相关API的说明pytorch框架中每种网络模型都有构造函数,在构造函数中定义模型的静态参数,这些参数将对模型所包含weights参数的维度进行设置。在运行时,模型的...
2018-12-12 13:25:26 7004 1
原创 sklearn cookbook 总结
Sklearn cookbook总结1 数据预处理1.1 获取数据sklearn自带一些数据集,可以通过datasets模块的load_*方法加载,还有一些数据集比较大,可以通过fetch_*的方式下载。下面的代码示例了加载boston的房价数据和下载california的房价数据的方法。from sklearn import datasetsboston = datasets.loa...
2018-11-03 12:10:34 1635
原创 Web框架Django使用概览
Web框架Django使用概览标签: django python1 开始一个新项目django的安装比较简单,在命令行里执行下面的命令。pip install django为了能使用django已有的模板代码,需要使用django-admin命令来执行诸如创建项目,创建项目下的子模块(在django中称为app)的工作。django-admin会帮我们准备好一系列目录结构和文件,在保...
2018-10-01 10:49:12 981
原创 流畅的Python学习
流畅的Python笔记 流畅的Python笔记 1 Python数据模型 2 数据结构 2.1 内置序列类型 2.2 列表推导与生成器表达式 2.3 元组 2.4 切片 2.5 序列对象上的+与* 2.6 sorted函数与list的sort方法 ...
2018-09-10 12:10:01 1884
原创 神经网络框架-Pytorch使用介绍
Pytorch上手使用近期学习了另一个深度学习框架库Pytorch,对学习进行一些总结,方便自己回顾。Pytorch是torch的python版本,是由Facebook开源的神经网络框架。与Tensorflow的静态计算图不同,pytorch的计算图是动态的,可以根据计算需要实时改变计算图。1 安装如果已经安装了cuda8,则使用pip来安装pytorch会十分简单。若使用其他...
2018-06-04 21:23:28 79340 8
原创 深度学习之五:序列模型与词向量
1 循环序列模型1.1 序列模型的适用范围序列模型是一种用于处理序列数据的模型,它可以用于语音识别,音乐生成,情感分类,机器翻译,命名实体识别等。模型的输出也可能是一个序列。1.2 相关的符号约定x<k>x<k>x^{} 表示输入序列中的第k个元素 y<k>y<k>y^{} 表示输出序列中的第k个元素 x(i)<k&...
2018-02-26 17:39:25 3623
原创 深度学习之四:卷积神经网络基础
计算机视觉在深度学习的帮助下取得了令人惊叹的进展,其中发挥重要作用的是卷积神经网络。本节总结了卷积神经的原理与实现方法。1 卷积神经网络1.1 计算机视觉与深度学习计算机视觉要解决的问题是如何让机器理解现实世界的现象。目前主要处理的问题如图像分类,目标检测,风格变换等。对于小型图片,如MNIST的图片处理,图像大小为64*64,使用全连接神经网络还可以处理。如果图像较大,如...
2018-02-19 19:24:58 3150
原创 深度学习之三:机器学习的策略
本文为Andrew ng深度学习课程的第三部分,主要总结了机器学习的策略方法。1 机器学习策略之一当我们的模型搭建出来之后,策略可以指引我们为了达到目标,如何采取下一步行动。1.1 正交化当设计和训练一个监督学习的系统时,我们依赖下面四条正交的假定:使模型在训练集上拟合,否则使用更大的神经网络或使用更好的优化算法。使模型在开发集上拟合,否则使用正则化或使用更大的训练集...
2018-02-16 10:22:15 2852
原创 深度学习之二:神经网络的实践与优化
本文内容为Andrew ng深度学习课程的第二部分的笔记,本篇总结了如何神经网络的训练和学习过程的实践经验与优化方法。1 深度学习的实践技巧应用机器学习是一个需要不断迭代的过程,众多经验参数如层数,隐层单元数,学习率,激活函数,权重参数的初始化方法等等众多的参数需要不断尝试改进以最终的得到较高的准确率。在这个过程中,有着众多的实践技巧。1.1 训练/开发/测试集如果针对某一监督...
2018-02-16 10:19:28 1793
原创 深度学习之一:神经网络与深度学习
深度学习之一:神经网络与深度学习1 简介本系列内容为Andrew NG的深度学习课程的笔记。深度学习课程在coursera及网易云课堂上都可以免费学习到。课程共计5部分,分别介绍了深度学习,深度学习的优化,深度学习项目的演进策略,卷积神经网络和循环神经网络。本系列笔记也分为5部分,分别与之相对应。本篇内容主要介绍如何使用numpy,通过梯度下降实现后向传播算法,完成从简单的单个...
2018-02-12 17:52:04 4774
原创 线性代数之七:矩阵的微分
向量与矩阵微分基础1 简介对于可导实函数f在某点x处的导数,有 f′(x)=limh→0f(x+h)−f(x)hf'(x)=\lim_{h\to 0}\frac{f(x+h)-f(x)}{h} 从形式上,则有: f′(x)⋅h≈f(x+h)−f(x)f'(x) \cdot h \approx {f(x+h)-f(x)} 本文将对向量和矩阵微分进行基础性的介绍,补充机器学习中所需要的微分计算基
2017-12-23 08:52:48 4765
原创 概率论基础之一:事件的概率
第1章 组合分析1.1 计数法则计数基本法则:有两个试验,试验1有m种可能发生的结果,而对于试验1的每一个结果,试验2有n种可能发生的结果,则对两个试验来说,一共有m*n种可能结果。计数法则推广:一共有k个试验,第一个试验有n1n_1种可能结果;对于第一个试验的每一种结果,第二个试验有n2n_2种可能结果;对应于前两个试验的每一种试验结果,第三个试验有n3n_3种可能结果;等等,则这r个试验一种有n
2017-11-26 17:25:19 3731
原创 线性代数之六:特征值与特征向量
6.1 特征值与特征向量特征向量:若A为n阶方阵,如果存在一个非零向量x使得Ax=λxAx=\lambda x,则称标量λ\lambda为特征值(eigenvalue),称x为属于λ\lambda的特征向量(eigenvector)。特征向量与零度空间:方程Ax=λxAx=\lambda x可以写为(A−λI)x=0(A - \lambda I)x=0,因此λ\lambda为特征值的充要条件是方程有
2017-11-12 14:26:53 11658
原创 线性代数之五:正交性
5.1 标量积5.1.1 向量余弦标量积定义:有两个RnR^n中的列向量x,y,则乘积xTyx^Ty称为x,y的标量积(scalar product),标量积为一个标量∑xiyi\sum x_i y_i向量的欧氏距离:若x∈Rnx\in R^n,则向量x的欧氏距离可通过标量积定义||x||=(xTx)12=(∑x2i)‾‾‾‾‾‾√||x|| = ({x^Tx})^\frac{1}{2}= \sqr
2017-11-08 21:58:03 17687
原创 线性代数之四:线性变换
4.1 定义线性变换:一个将向量空间V映射到向量空间W的映射L,如果对所有V中的向量v以及标量a,b,都有L(av1+bv2)=aL(v1)+bL(v2)L(av_1+bv_2)=aL(v_1)+bL(v_2),则称L为V的线性变换(Liner transformation),记作L:V−>WL:V->W,如果V和W是相同的,称L是V的线性算子(liner operator)。线性变换的性质:若L为
2017-11-06 22:42:27 11670
原创 线性代数之三:向量空间
3.1 向量空间定义令V为一定义了加法和标量乘法的集合。对V中的任意元素x,y,x+y仍在V中。对于任意标量c,积cx仍在V中。同时若V还满足下面的公理,则V称为向量空间。对V中任意x和y,x+y=y+x对V中任意x,y和z,(x+y)+z = x+(y+z)V中存在一个元素0,满足对任意的x都有x+0=xV中任意元素x,都存在一个元素-x,满足x+(-x)=0对任意标量c,都有c(x+y
2017-11-02 21:14:25 4423
原创 NLTK学习之四:文本信息抽取
1 信息抽取从数据库中抽取信息是容易的,但对于从自然文本中抽取信息则不那么直观。通常信息抽取的流程如下:它开始于分句,分词,接下来进行词性标注,识别其中的命名实体,最后使用关系识别搜索相近实体间的可能的关系。
2017-08-19 17:20:20 27670 1
原创 NLTK学习之三:文本分类与构建基于分类的词性标注器
分类是为给定输入选择正确的类标签的任务。比如判断一封Email是否是垃圾邮件,确定一篇新闻的主题。 如果分类需要人工标准的标签进行训练,则称为有监督分类。特征是一个非常重要的概念。使用分类器首先要决定选择什么 样的特征,以及对特征进行编码。如果没有特征直接输入原始数据,则数据会十分离散而难以训练出有用的模型。
2017-08-17 17:09:54 8421
原创 NLTK学习之二:建构词性标注器
自然语言是人类在沟通中形成的一套规则体系。规则有强有弱,比如非正式场合使用口语,正式场合下的书面语。要处理自然语言,也要遵循这些形成的规则,否则就会得出令人无法理解的结论。
2017-08-14 18:30:16 6565
原创 NLTK学习之一:简单文本分析
nltk的全称是natural language toolkit,是一套基于python的自然语言处理工具集。1 NLTK的安装nltk的安装十分便捷,只需要pip就可以。pip install nltk在nltk中集成了语料与模型等的包管理器,通过在python解释器中执行>>> import nltk>>> nltk.download()便会弹出下面的包管理界面,在管理器中可以下载语料,预训练
2017-08-13 21:09:07 60023 8
原创 Keras学习之四:用RNN进行评论好恶预测
RNN即循环神经网络,其主要用途是处理和预测序列数据。在CNN中,神经网络层间采用全连接的方式连接,但层内节点之间却无连接。RNN为了处理序列数据,层内节点的输出还会重新输入本层,以实现学习历史,预测未来。 RNN的两个主要改进是LSTM(长短时记忆网络)和GRU(门控循环单元),二者为基本神经单元增加了额外的功能门,从而更好的实现长时记忆的处理。
2017-08-02 17:40:43 7423 9
原创 Keras学习之三:用CNN实现cifar10图像分类模型
卷积神经网络简介卷积神经网络和全连接神经网络一样,都是由多个神经网络层连接而成。不同的是CNN一般是由多个卷积层,池化层交替连接起来,用于提取输入数据的高层特征,并缩小数据的维度。最后对提取出的特征进行神经网络分类形成最终的输出。
2017-07-29 21:32:46 19009 1
原创 keras学习之二:神经网络模型的使用
keras提供了两种模型,一种是Sequential,译做序列模型。另一种是Functional,译做函数型模型。二者可以从使用形式来区分,序列模型可以看做是面向对象的方法,一系列对象协作完成任务。函数模型则是一系列的过程调用来完成任务。
2017-07-27 13:01:05 6278 1
原创 Keras学习之一:文本与序列预处理
1 简介在进行自然语言处理之前,需要对文本进行处理。 本文介绍keras提供的预处理包keras.preproceing下的text与序列处理模块sequence模块2 text模块提供的方法text_to_word_sequence(text,fileter) 可以简单理解此函数功能类str.splitone_hot(text,vocab_size) 基于hash函数(桶大小为voca
2017-07-26 14:52:30 13910
原创 Artifactory的搭建与使用简介
Jfrog的Artifactory是一款Maven仓库服务端软件,可以用来在内网搭建maven仓库,供公司内部公共库的上传和发布,以提高公共代码使用的便利性。1 Artifactory开源版本在Linux下的安装与启动安装相对比较简单,从Jfrog网站下载当前最新版本的rpm包到本地,当前最新版是4.7.6,执行rpm -ivh命令进行安装。默认安装到/opt/jfrog目录下。安装包
2016-05-20 11:57:27 44322 1
原创 设计模式与实例代码:Proxy模式
定义与意图:为某一对象提供一个代理和占位,以达到控制访问的目的。有三种不同的代理,远程代理,虚拟代理,保护代理。类图:对比:主要是使用场景上容易和装饰器模式混淆。因为我们在代理类中为真正的被代理对象装饰了一定的功能,但从类图结构上,二者有较大的区分度。代理需要转发被代理对象的所有接口。而装饰器类没有这种约束。在选择上,主要从意图上进行区分。如果目的是接管某一类型的所有操
2016-04-17 19:18:23 1326
原创 Android获取存储路径API的说明
Android手机的存储分为几种不同的类型,不同的厂家定制过程中稍有不同,下面列出在红米1上的测试结果,对进行说明。先看下此手机系统存储的j显示情况,以及df显示的文件系统挂载情况 通过对比,可以得出下面的结论:1 机身内置存储器emmc被划分成若干个不同的分区,并挂载到不同的路径下:/system 系统主目录,这里是系统核心文件的目录,其下主要是系统文件、lib库
2016-03-20 20:47:01 3589
原创 GlusterFs分布式复本卷 服务器替换实践
出于存储安全的需要,近期新建了一个分布式复本卷来存储一些重要数据。服务器从gfserver20-29,然而使用没几天,一台服务器gfserver26的操作系统就崩溃了,一执行命令就报I/O error,应该是硬盘挂掉了。运维的同事帮忙更换了硬盘了,重新安装了操作系统。不幸的是复本卷的数据也被格式化了。幸好这个卷是复本卷,新的设备上线之后,可以重新进入集群,并恢复成原貌。这就是复本卷的优势。
2015-07-01 17:59:34 4816 3
原创 《交互设计之路》读书笔记
作者名为Alan Copper,被称为VB之父,是可视化编程思想的发明者。其将VB推荐给了Bill Gates。后其个人成立产品设计公司,专门为高科技产品公司进行产品设计。本文总结了一些Copper在交互设计之路一书的一些思想。如果不愿意精读这本书,理解这下面这段话即可。软件产品要想成功,必须经过产品经理的市场调研,即商业可行性分析。在验证了商业可行之后,由设计师进行用户角色分析,
2014-12-20 15:25:36 2139
原创 mit-scheme user manual note
1 InstallationGoto page http://www.gnu.org/software/mit-scheme/ and find your os's source code and download it to local filesystem, decompress the tarbal. In the source code directory,run./configu
2014-11-30 21:24:40 1754
原创 GlusterFS分布式文件系统使用简介
0 术语简介GlusterFS是一个开源的分布式文件系统。更多特性介绍附录的参考文档。Brick:GFS中的存储单元,通过是一个受信存储池中的服务器的一个导出目录。可以通过主机名和目录名来标识,如'SERVER:EXPORT'Client: 挂载了GFS卷的设备Extended Attributes:xattr是一个文件系统的特性,其支持用户或程序关联文件/目录和元数据
2014-09-24 20:05:06 65136 3
原创 使用Percona XtraBackup对MySQL进行在线热备份
XtraBackup提供了对MySQL数据的热备份功能,支持innodb和myisam引擎。1 安装yum install perlyum install perl-Time-HiReshttp://www.percona.com/downloads/XtraBackup/LATEST/binary/ 页面下载对应系统的二进制包2 权限备份需要reload,lo
2014-06-15 15:07:49 3525
原创 MySQL参考手册第7章:数据库的备份与恢复
1 备份与恢复类型1.1 物理备份与逻辑备份物理备份复制存储数据内容的目录和文件,这种方式适合大型及重要的企业数据库。输出压缩比大备份方式比较快备份时需要锁定相应的库、表可以备份对应的日志和配置文件备份只能在具有相同物理特性的设备上使用备份包含了精确的数据库目录和文件的复本逻辑备份保存生成数据库及数据的SQL语句,这种方式适合少量数据的数据库。输出压缩比小备
2014-06-12 18:04:03 2085
原创 MySQL参考手册第6章:MySQL服务器安全
1 一般安全问题1.1 安全性指南不仅需要考虑MySQL自身的安全性,主机和网络的安全性都是需要考虑的。下面是一些指南 保护好root权限,其他用户不要访问user表 理解MySQL的权限系统 不要存储和传输明文密码,不要使用字典密码 投资防火墙安全设备 过滤应用提交的数据 1.2 保护密码的安全 1.2.1 密码与日志写在SQL语句中的明文密码,如create
2014-06-10 13:24:57 1954
Cisco IPv6实现技术
2009-03-04
Programming with posix threads
2008-12-19
Linux网络协议栈架构--设计与实现
2008-11-25
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人