自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

Rachel Zhang的专栏

因为理想,所以拼搏,关注计算机应用的点点滴滴……

  • 博客(7)
  • 资源 (16)
  • 收藏
  • 关注

原创 php实现Bloom Filter

Bloom Filter(BF) 是由Bloom在1970年提出的一种多哈希函数映射的快速查找算法,用于**快速**查找某个元素是否属于集合, 但不要求百分百的准确率。 Bloom filter通常用于爬虫的url去重,即判断某个url是否已经被爬过。 看过几个php实现的BF,都觉得可读性不是很强, 本文主要给出我对Bloom Filter的一个php实现。

2015-07-24 19:20:15 13610 3

原创 php如何显示错误信息

php默认不打印错误,如需打印,vi $PHP_HOME/etc/php.ini, 修改以下几项:display_errors = Onerror_reporting = E_ALL & ~E_NOTICE如果有设error_log变量,注释掉输出到error_log这句话就可以将错误直接显示在terminal了然后重启php:$PHP_HOME/sbin/php-fpm start

2015-07-24 12:56:22 16040 2

原创 UnicodeDecodeError: 'ascii' codec can't decode byte 0xe5 in position 0: ordinal not in range(128)

python的编码问题一直是头痛,比如matplotlib画图只接受utf-8编码,如果没有设置就会在画图时报错。 有时间整整这个python编码;如标题所示,解决方案:加入import sysreload(sys)sys.setdefaultencoding("utf-8")

2015-07-23 14:14:58 16178 1

原创 shell 例程 —— 解决redis读取稳定性

问题背景: php读取线上redis数据,经常不稳定,数据响应时有时无。 解决方法:多次读取,每次读取所有上一次没读出的数据,直到全部获取。本文实现用shell进行多次redis数据读取, 每次取出其中的有效值(对于我们的例子中,就是给key,能在redis上取得其value的为有效值,其他无效),并将无效值重跑一遍,以此迭代,直到所有redis数据被取出。PS:redis数据可以由php或

2015-07-22 13:41:07 14097

转载 Linux下批量删除空文件

Linux下批量删除空文件(大小等于0的文件)的方法find . -name "*" -type f -size 0c | xargs -n 1 rm -f用这个还可以删除指定大小的文件,只要修改对应的 -size 参数就行,例如:find . -name "*" -type f -size 1024c | xargs -n 1 rm -f就是删除1k大小的文件。(但注意 不要用 -size 1k

2015-07-13 12:27:31 18215 1

原创 匹配不包含指定中文字符的行

上一篇利用正则表达式匹配不包含某些指定字符的只是动动脑机,回忆一下正则表达式, 但是遇到了中文,一来编码问题不方便, 二来容易考虑问题有漏洞。 如果我们想实现匹配不包含某些字符串的功能, 还是用shell脚本比较安全。如下面这段代码实现匹配所有不含“登录”和“注册”的行。其中, “=~”表示包含。str="登录|注册"while read line; do if [[ ! $line =~

2015-07-09 21:45:26 10525

转载 利用正则表达式排除特定字符串

本文转载自:http://www.cnblogs.com/wangqiguo/archive/2012/05/08/2486548.html查找不以baidu开头的字符串baidu.comsina.com.cn正则:^(?!baidu).*$  匹配结果就是第2行,也就是第1行被排除了这里使用了零宽度断言(?!exp),注意,我们有一个向前查找的语法(也叫顺序环视)  (?=exp)(?=exp)

2015-07-09 20:39:44 15798

python实现并行爬虫

指定爬虫depth、线程数, python实现并行爬虫

2015-09-07

python实现网络图片爬虫

程序支持多线程爬虫,主文件为spider.py, testSpider.py为单测

2015-09-07

gputimer.h

CUDA系列学习(四)Parallel Task类型 与 Memory Allocation 配套代码 获取gpu时间

2015-02-03

LR_Mnist.py

http://blog.csdn.net/abcjennifer/article/details/25912675 的辅助代码,利用stochastic gradient descent 进行logistic regression, 应用于mnist数据集

2015-01-07

deep learning 概览+时序模型

Content 1. 回顾 deep learning在图像上的经典应用 1.1 Autoencoder 1.2 MLP 1.3 CNN<详细的见上一篇CNN> 2. deep learning处理语音等时序信号 2.1 对什么时序信号解决什么问题 2.2 准备知识 2.2.1 Hidden Markov Model(HMM) 2.2.2 GMM-HMM for Speech Recognition 2.2.3 Restricted Boltzmann Machine(RBM) 3.

2014-05-29

Convolution Neural Network (CNN)

PS:本篇blog为ese机器学习短期班参考资料(20140516课程),本文只是简要讲最naive最simple的思想,重在实践部分,原理课上详述。

2014-05-15

20newsgroup python分类聚类

http://blog.csdn.net/abcjennifer/article/details/23615947

2014-04-13

人脸检测与识别

环境:opencv 2.4.6.0 特征:eigenface Input:一个人脸数据库,15个人,每人20个样本(左右)。 Output:人脸检测,并识别出每张检测到的人脸。

2014-03-16

决策树python实现

基于python逐步实现Decision Tree(决策树),分为以下几块: 加载数据集 熵的计算 根据最佳分割feature进行数据分割 根据最大信息增益选择最佳分割feature 递归构建决策树 样本分类

2014-03-10

KMeans和Kmedoid算法的matlab实现

本资源为KMeans和KMedoid算法的实现,算法讲解见http://blog.csdn.net/abcjennifer/article/details/8197072

2012-11-18

C++矩阵处理工具——Eigen3

C++矩阵处理工具——Eigen3工具包,其内部封装了很多矩阵类,可以在C++环境轻松进行矩阵处理(与操作系统无关,window,linux均可)。 附上Eigen3的讲解链接:http://blog.csdn.net/abcjennifer/article/details/7781936

2012-07-24

压缩感知基础

压缩感知基础内容,包括陶哲轩在外面讲座的ppt和一些大牛对CS的见解。

2012-07-15

Difference of Gaussian DoG

DoG (Difference of Gaussian)实现角点检测。 效果见http://blog.csdn.net/abcjennifer/article/details/7639488#comments

2012-06-09

libsvm 程序集数据集

libsvm 数据集 包括 matlab数据集 和 VC数据集

2012-04-11

广度有限搜索 bfs 基础 骑士的任务 课件

详细讲解了骑士的任务用队列方法解决的策略,层层深入

2009-10-14

动态规划基础(初学者必读)

详细的讲解了动态规划基本思想,基本步骤,内附经典例题!(包括经典的背包问题,初学者必看)!前提 ●贪心法(它是一种多步决策法,它总是作出在当前看来是最好的选择,它的考虑不是从整体出发,而只是某种意义上的局部最优,这样贪心法不能对所有问题达到整体最优解,但是对相当范围的许多问题都能够产生整体最优解。--译者) ●动态规划(它是将问题进行逐步的划分来缩小问题的规模,直到可以求出子问题的解为止。分划子问题后,对应的子问题中含有大量的重复,这样就将重复地求解;在第一次遇到重复时把它解决,并将解保存起来,以备后面引用。动态规划法常用来求一个问题在某种意义下的最优解。--译者) ●递归下降

2009-10-14

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除