自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(20)
  • 资源 (4)
  • 收藏
  • 关注

原创 基于CNN的短文本分类实验 PPT

基于卷积神经网络的短文本分类实验,在搜狐新闻上取得了不错的分类效果,但情感分析的效果很差,需要继续改进。

2016-03-18 20:15:38 5860 3

原创 Python中的readlines函数读取到特殊字符时会截断导致文件读取不完整

Python 2.7.8 f = open(path, 'r') text_src = [line.strip() for line in f.readlines()]逐行读取一个文本文件(utf-8编码)到一个list,发现list的元素个数比文本文件的行数小得多。经调查,发现list内容不完整,说明readlines函数返回的不是所有行的列表。当遇到一

2016-03-08 20:34:09 2511

原创 Supervised Deep Learning with Auxiliary Networks

2015-06-15 19:17:18 951 1

原创 练习使用Python+Scikit-learn预测航班延误

按照这篇博客的步骤进行。由于系统中没有安装PIG,故没有按文中的方式生成训练和测试数据,而是用Spark生成。系统环境为JDK 1.7,Spark 1.2.0, Scala 2.10.4,Python 2.7. Python最好使用集成安装包如Anaconda安装,会安装大部分扩展包。1.  安装pydoop可以使用pydoop库访问HDFS。下载后解压,在根目录执行p

2015-01-21 19:31:26 5434

原创 练习使用Spark and ML-Lib 预测航班延误

按照这篇博客的步骤进行。其中有些注意事项列在下面。系统环境为JDK 1.7,Spark 1.2.0, Scala 2.10.4。1. 下载joda-convert 1.2, 将jar包加入IntelliJ IDEA的Library路径。2. 下载joda-time, 将jar包加入IntelliJ IDEA的Library路径。

2015-01-20 22:39:19 1991 1

原创 在Python集成开发环境中调用Spark MLlib

Python拥有众多优秀的机器学习库如Scikit-Learn,然而这些机器学习库都在单机上运行,不支持集群上的分布式机器学习。Spark MLlib是Spark的机器学习库,并且支持Python。

2015-01-14 20:40:39 2994

原创 ImageNet Classification with Deep Convolutional Neural Networks 阅读理解及问题

看了这篇论文和网上的阅读笔记,还没看代码。有一些问题列在这里,看看自己以后能不能回答。1. 用GPU加速训练,论文提到是用GPU做2D卷积,而实际的网络都是3D的卷积计算,这个怎么对应?怎样计算3D卷积?2. 论文中的深度CNNs使用激活函数f(x) = max(0, x), 称为ReLU Nonlinearity。这比sigmoid、双曲正切作为激活函数在训练速度上要快好

2015-01-10 20:21:33 854

原创 SparkR安装注意事项

系统环境为CentOS 6.5 + Spark 1.2.0。首先安装R,去官方网站下载R for linux源码,目前最新版为3.1.2,解压缩后在根目录执行./configure。若出现错误“configure: error: --with-readline=yes (default) and headers/libs are not available”,则执行yum instal

2015-01-07 13:53:45 1191

原创 学习情报收集 2014-12

计划不定期收集些学习方面的信息,便于从中选择学习。YC的新主席Sam Altman与Stanford联合开了一门创业课,叫“How to start a startup”。课程请到了许多著名的创业者和投资人作为嘉宾,旨在教授所有想创业的人该如何创业。这里是带字幕版的课程视频地址:How to Start A Startup

2014-12-27 22:50:59 651

原创 MLbase: A Distributed Machine-learning System 阅读笔记

前几日读过的一篇论文,笔记做成了ppt。

2014-12-26 15:34:25 889

原创 Exercise:Convolution and Pooling 代码示例

练习参考Convolution and Pooling       这个练习用于处理大型图像,需要编写代码实现卷积特征提取和池化(采样)两个过程。在上一个练习中,通过小尺寸图像样本训练线性编码器得到的权重矩阵、偏差向量以及预处理的ZCA白化矩阵、均值向量存为文件STL10Features.mat。此练习利用STL10Features.mat中的特征与大图作卷积生成卷积特征矩阵。

2014-12-25 16:56:23 1779

原创 Exercise:Learning color features with Sparse Autoencoders 代码示例

练习参考Learning color features with Sparse Autoencoders将稀疏自编码器修改为线性解码器,只需把第三层改为线性函数如a(3) = z(3) 即可,并修改相应的梯度计算公式。sparseAutoencoderLinearCost.mW1 = reshape(theta(1:hiddenSize*visibleSize), hidden

2014-12-24 23:07:33 673

原创 Exercise: Implement deep networks for digit classification 代码示例

练习参考Implement deep networks for digit classification       这个练习用到了一个四层的深度神经网络。第一层是数据输入层;第二、三层是稀疏自编码器层,分别取两个稀疏自编码器的隐藏层作为第二、三层;第四层为Softmax分类器,用于分类0到9的手写数字。在训练Softmax分类器后,又对整个网络进行了微调。在微调时,需要把L2~L4这

2014-12-24 20:23:05 814

原创 Exercise:Self-Taught Learning 代码示例

练习参考Self-Taught Learning结合使用稀疏自编码器和Softmax分类器对0到4的手写数字进行分类。首先利用稀疏自编码器无监督学习手写数字5到9的特征。利用学到的权重和偏置计算手写数字0到4的激活值,并将激活值作为Softmax分类器的输入进行分类(有监督学习)。Train the sparse autoencoderopttheta = th

2014-12-23 17:13:14 613

原创 Exercise:Softmax Regression 代码示例

练习参考Softmax Regressionsoft

2014-12-22 23:52:29 553

原创 Exercise:PCA and Whitening 代码示例

练习参考PCA and Whitening,与上一个练习基本一致。更改图像数据的均值avg = mean(x,1);x = x - repmat(avg,size(x,1),1);Implement PCA to obtain xRotxRot = zeros(size(x));sigma = x * x' / size(x,2); [u,s,v

2014-12-22 16:20:05 725

原创 Exercise:PCA in 2D 代码示例

练习参考PCA in 2D实现主成分分析和白化的过程是:pca_2d.m中代

2014-12-22 14:51:26 689

原创 Exercise:Vectorization 代码示例

练习参考Vectorization需要在练习Sparse Autoencoder的基础上做。可将Sparse Autoencoder拷贝一份并重命名为Vectorization。下载教程提供的数据,解压缩后将train-images-idx3-ubyte、train-labels-idx1-ubyte、loadMNISTImages.m和loadMNISTLabels.m文件放在tra

2014-12-22 09:52:35 1000

原创 Exercise:Sparse Autoencoder 代码示例

练习参考Sparse Autoencoder第一步,生成训练数据。在sampleIMAGES.m文件中加入如下代码:

2014-12-21 16:20:42 1031

原创 Large Scale Distributed Deep Networks 阅读笔记

Large Scale Distributed Deep NetworksJeffrey Dean, Greg S. Corrado, Rajat Monga, Kai Chen,Matthieu Devin, Quoc V. Le, Mark Z. Mao, Marc’Aurelio Ranzato,Andrew Senior, Paul Tucker, Ke Yang, And

2014-12-17 09:13:00 1758

SQL_Server_7编程技术内幕

本书从SQL Server 7编程的各个方面深入讨论,以数百个实例和大量图表详细讲解高级T-SQL编程、SQL Server 7的最新特性、多层应用编程、数据迁移及集成、各种应用程序接口等专题。读者可以直接将这些技术运用于相应场景,获得完善稳定的高性能应用。本书是SQL Server 7高级编程人员的必备工具书,也可供SQL Server系统管理人员、数据库设计人员参考。

2010-12-03

SQL_Server_7资源指南

本书是SQL Server 7 资源的参考手册。内容包括:SQL Server 7的体系结构和组件;规划SQL Server 7 的资源和现有应用程序;为数据仓库、轻便应用程序和联机解析处理配置SQL Server 解决方案;移植和升级;疑难解析;灾难恢复等等。本书可以指导用户设计数据库解决方案、管理一个或多个SQL Server 数据库,以及为优化数据库操作设计应用程序。本书适合SQL Server专业用户使用,但对于SQL Server 初学者和数据库专业人员也不失为一本难得的好书。

2010-12-03

清华殷人昆数据结构笔记

清华殷人昆数据结构笔记(c++) 学习数据结构

2010-12-03

设计模式精解(GoF 23种设计解析附C++实现源码)(Build 0510).pdf

设计模式精解(GoF 23种设计解析附C++实现源码)

2010-10-25

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除