自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

Ryan Z 的技术日志

千里之行,始于足下

  • 博客(72)
  • 收藏
  • 关注

转载 casperjs无法加载https的网页

今天用我的写的casper脚本: 来截网页的时候,截出来是个空的图片,半天没发现原因。加强了几个地方的代码之后还是出现同样的问题,最后定睛一看,发现打出来的debug信息里有这么一条蛋黄蛋黄的warning信息: [warning] [phantom] Loading resource failed with status=fail: https://...,原因是因为该网页是https的。

2015-08-31 13:35:09 2249

转载 用casperjs截取任意网页区域

随着网络技术的发达,我们越来越多的用到截图功能。windows上面有非常人性化的QQ截图。浏览器里也有方便的截图插件。今天宝哥来教你怎么用代码截取网页存为图片。这对于一些出于各种目的写自动化脚本的,还有一些Linux用户来说,还是很需求的。而且,即使是windows用户,对一个网页需要滚屏才能显示完的内容来说,要用截图工具来边滚边截还是很(Mei)有(You)难(Ke)度(Neng)的。pha

2015-08-31 13:34:30 1107

转载 phantomjs/casperjs动态传入参数

我们常用phantomjs/casperjs脚本来做一些事情。有时候希望从外部动态传入参数来进行操作。如何实现呢?介绍三种办法:1.通过phantomjs.args获取参数即在脚本中直接调用phantom.args,即可获取到命令行参数数组。注意,它默认会带三个内部参数在数组前面。第一个casperjs的安装路径,第二个casperjs的参数--cli,第三个是当前脚本名称(含路径)。之后

2015-08-31 13:32:03 2285

转载 Ubuntu安装Casperjs

1.安装phantomjs—-下载程序文件wget https://phantomjs.googlecode.com/files/phantomjs-1.9.2-linux-x86_64.tar.bz2,32位ubuntu下载链接应该是https://phantomjs.googlecode.com/files/phantomjs-1.9.2-linux-i686.tar.bz2。

2015-08-31 13:29:41 1063

转载 Linux双网卡绑定实践

Linux双网卡绑定实践By wsgzao 发表于 2015-02-09前言工作中主要以SuSE为主,网络作为整个高可用架构中最重要的环节之一,在物理上一般是双网卡绑定模式,通常使用默认的mode=1(active-backup)作为主备关系。在最近测试大数据的生产服务器中,考虑到性能优先,所以将绑定模式设置为mode=6(balance-alb),使用负载均衡提高1倍流量

2015-08-28 11:22:52 636

转载 使用Samba实现Linux与Windows文件共享实践

使用Samba实现Linux与Windows文件共享实践By wsgzao 发表于 2015-07-11前言一直以来都以为FTP和NFS是局域网文件共享的常用方式,但是在最近接触Samba之后,了解到一些用户需要简化访问学习成本,满足基础的权限控制管理,并支持实时编辑和保存文件,我才明白这些需求使用之前的方法都是很难满足的,而Samba却可以完美的支持上述需求,虽然在开始接

2015-08-28 10:58:58 565

转载 Windows上使用Vagrant打造Laravel Homestead可协同跨平台开发环境

Windows上使用Vagrant打造Laravel Homestead可协同跨平台开发环境By wsgzao 发表于 2015-07-18前言大家对VMware或者VirtualBox一定不会陌生,虚拟化的好处自然深入人心,而现在我们可以通过Vagrant搭建一套类似Laravel Homestead完整开发环境,这样极大的减少了架设开发环境的时间,同时还支持在Windo

2015-08-28 10:57:10 1076

转载 iptables配置实践

iptables配置实践By wsgzao 发表于 2015-07-24前言在大企业中防火墙角色主要交给硬件来支持,效果自然没话说只是需要增加一点点成本,但对于大多数个人或者互联网公司来说选择系统自带的iptables或者第三方云防火墙似乎是更加合适的选择,通过一些合理的优化和灵活的配置,我们也可以很轻松实现硬件防火墙的部分功能,够用就好。建立防火墙白名单机制很重要

2015-08-28 10:51:20 554

转载 XtraBackup不停机不锁表搭建MySQL主从同步实践

XtraBackup不停机不锁表搭建MySQL主从同步实践By wsgzao 发表于 2015-08-07前言Percona XtraBackup可以说是一个相对完美的免费开源数据备份工具,支持在线无锁表同步复制和可并行高效率的安全备份恢复机制相比mysqldump来说确实让人眼前一亮,与MySQL Enterprise Backup(InnoDB Hot Backup)的

2015-08-28 10:50:28 658

转载 SSH使用密钥登录并禁止口令登录实践

SSH使用密钥登录并禁止口令登录实践By wsgzao 发表于 2015-08-13前言无论是个人的VPS还是企业允许公网访问的服务器,如果开放22端口的SSH密码登录验证方式,被众多黑客暴力猜解捅破菊花也可能是经常发生的惨剧。企业可以通过防火墙来做限制,普通用户也可能借助修改22端口和强化弱口令等方式防护,但目前相对安全和简单的方案则是让SSH使用密钥登录并禁止口令登录。

2015-08-28 10:49:13 449

转载 vsftpd安装以及配置FTP虚拟用户实践

vsftpd安装以及配置FTP虚拟用户实践By wsgzao 发表于 2015-08-24前言正如vsftpd官方宣传中所说Probably the most secure and fastest FTP server for UNIX-like systems.我相信这是大多数人选择vsftpd来搭建Linux的FTP服务器的原因,当然ProFTPD用的人应该也不在少数。文章

2015-08-28 10:48:04 406

转载 LTMP手动编译安装以及全自动化部署实践

LTMP手动编译安装以及全自动化部署实践By wsgzao 发表于 2015-08-14前言现在很多朋友都了解或者已经在使用LNMP架构,一般可以理解为Linux Shell为CentOS/RadHat/Fedora/Debian/Ubuntu/等平台安装LNMP(Nginx/MySQL/PHP),LNMPA(Nginx/MySQL/PHP/Apache),LAMP(Apa

2015-08-28 10:45:22 1184

转载 创业者需要知道的50句话

作者: 阮一峰日期: 2010年9月 8日网上有很多创业的经验谈。David Cummings 从中总结了50句话,放在一起看,确实很令人收益。==================================创业者需要知道的50句话作者:David Cummings译者:阮一峰1.只管去做。Just

2015-08-27 17:02:29 430

转载 Securing a Linux Server

It is a rarity to watch someone secure a freshly installed server right off the bat, yet the world we live in makes this a necessity. So why do so many people put it off until the end, if at all? I’ve

2015-08-27 17:01:37 741

转载 SSH原理与运用

作者: 阮一峰日期: 2011年12月21日SSH是每一台Linux电脑的标准配置。随着Linux设备从电脑逐渐扩展到手机、外设和家用电器,SSH的使用范围也越来越广。不仅程序员离不开它,很多普通用户也每天使用。SSH具备多种功能,可以用于很多场合。有些事情,没有它就是办不成。本文是我的学习笔记,总结和解释了SSH的常见用法,希望对大家有用。虽然本文

2015-08-27 16:59:50 351

转载 Linux服务器的初步配置流程

作者: 阮一峰日期: 2014年3月14日开发网站的时候,常常需要自己配置Linux服务器。本文记录配置Linux服务器的初步流程,也就是系统安装完成后,下一步要做的事情。这主要是我自己的总结和备忘,如果有遗漏,欢迎大家补充。下面的操作针对Debian/Ubuntu系统,其他Linux系统也类似,就是部分命令稍有不同。第一步:root用户登录

2015-08-27 16:58:35 416

转载 PostgreSQL新手入门

作者: 阮一峰日期: 2013年12月22日自从MySQL被Oracle收购以后,PostgreSQL逐渐成为开源关系型数据库的首选。本文介绍PostgreSQL的安装和基本用法,供初次使用者上手。以下内容基于Debian操作系统,其他操作系统实在没有精力兼顾,但是大部分内容应该普遍适用。一、安装首先,安装PostgreSQL客户端。

2015-08-27 16:57:36 401

原创 Sublime Text 3 插件

Package Control        安装包控制, 按下Control + `,输入  https://sublime.wbond.net/installation#st3 中的内容import urllib.request,os,hashlib; h = 'eb2297e1a458f27d836c04bb0cbaf282' + 'd0e7a3098092775ccb37ca9d6b2

2015-08-26 15:15:31 3438

转载 Java OCR tesseract 图像智能字符识别技术 Java代码实现

转自:http://blog.csdn.net/lmj623565791/article/details/23960391接着上一篇OCR所说的,上一篇给大家介绍了tesseract 在命令行的简单用法,当然了要继承到我们的程序中,还是需要代码实现的,下面给大家分享下java实现的例子。拿代码扫描上面的图片,然后输出结果。主要思想就是利用Java调用系统任务。

2015-08-24 12:11:54 1543

转载 Java OCR tesseract 图像智能字符识别技术

转自:http://blog.csdn.net/lmj623565791/article/details/23955883公司有需求啊,所以就得研究哈,最近公司需要读验证码,于是就研究起了图像识别,应该就是传说中的(OCR:光学字符识别OCR),下面把今天的收获整理一个给大家做个分享。本人程序用的tesseract,官方地址:https://code.google.com/p/

2015-08-24 12:10:35 590

转载 Java中文图像识别tesseract-ocr || tif

esseract-ocr引擎最初是由惠普开发的,后来开源了然后交给谷歌打理进行优化工作了。3.0版本开始支持中文OCR,对于中文图像的识别。尽管效果并不如人意,但是只要图像够清晰,还是能够凑合着用的。PS:com.input.ocr下的java类文件是copy网友所写的,感觉只是把它当成工具起辅助作用,就没有深入研究了,大概看了一下作为主体的两个类主要是一些流的操作。在java中调

2015-08-24 12:09:23 2721

转载 Tesseract-OCR 字符识别---样本训练

转自:http://blog.csdn.net/firehood_/article/details/8433077Tesseract是一个开源的OCR(Optical Character Recognition,光学字符识别)引擎,可以识别多种格式的图像文件并将其转换成文本,目前已支持60多种语言(包括中文)。 Tesseract最初由HP公司开发,后来由Google维护,目前发布在G

2015-08-24 11:57:16 804

转载 Java OCR 图像智能字符识别技术,可识别中文

转自:http://lwg2001s.iteye.com/blog/1260413几天一直在研究 OCR 技术,据我了解的情况,国内最专业的 OCR 软件只有 2 家,清华 TH-OCR 和汉王 OCR ,看了很多的 OCR 技术发现好多对英文与数字的支持都很好,可惜很多都不支持中文字符。 Asprise-OCR , Tesseract 3.0 以前的版本,都不支持中文,其实我用了下 As

2015-08-24 11:55:18 887

转载 微信公众帐号开发教程

微信公众帐号开发教程http://blog.csdn.net/gebitan505/article/category/2212915/2

2015-08-13 22:23:42 533

转载 MySQL-- 每半月一个分区,自动维护

建表语句 drop table if exists terminal_parameter;CREATE TABLE `terminal_parameter` (  `terminal_parameter_id` int(11) NOT NULL AUTO_INCREMENT,  `serial` int(11) DEFAULT NULL,  `network

2015-08-13 22:22:45 420

转载 超酷jQuery进度条加载动画集合

在丰富多彩的网页世界中,进度条加载动画的形式非常多样,有利用gif图片实现的loading动画,也有利用jQuery和CSS3实现的进度加载动画,本文主要向大家介绍很多jQuery和CSS3实现的进度条加载动画,每一个都非常具有创意。如果你喜欢,可以下载源码并将它们应用到自己的网站中去。HTML5 Canvas发光Loading动画它是一个Loading加载动画,并不能实现具体进度

2015-08-13 22:20:36 2151

转载 语义分析的一些方法(三) 图像语义分析

语义分析的一些方法(三)2015/02/04机器学习、自然语言处理、计算广告学vincentyao3 图片语义分析3.1 图片分类图片分类是一个最基本的图片语义分析方法。基于深度学习的图片分类传统的图片分类如下图所示,首先需要先手工提取图片特征,譬如SIFT, GIST,再经由VQ coding和Spatial pooling,最后送入传统的分类模型(例

2015-08-13 22:20:10 3922

转载 语义分析的一些方法(二)

语义分析的一些方法(二)2015/02/04机器学习、自然语言处理、计算广告学vincentyao2 文本语义分析前面讲到一些文本基本处理方法。一个文本串,对其进行分词和重要性打分后(当然还有更多的文本处理任务),就可以开始更高层的语义分析任务。2.1 Topic Model首先介绍主题模型。说到主题模型,第一时间会想到pLSA,NMF,LDA。关于这几个目前业

2015-08-13 22:19:23 796

转载 语义分析的一些方法(一)

语义分析的一些方法(一)2015/02/04机器学习、自然语言处理、计算广告学vincentyao语义分析,本文指运用各种机器学习方法,挖掘与学习文本、图片等的深层次概念。wikipedia上的解释:In machine learning, semantic analysis of a corpus is the task of building structures that a

2015-08-13 22:18:19 811

转载 [我们是这样理解语言的-3]神经网络语言模型(续)

8 Eric Huang’s Model在Bengio的神经网络结构的基础上,Eric Huang提出了引入文档的全局信息引神经网络语言模型,结构类似于Bengio的网络结构。8.1 模型结构相比Bengio的模型,Eric Huang引入了词的全局信息,在原本的网络结构中加入了子网络,形成如下图所示结构。图5 Eric Huang的网络结构图其中,

2015-08-13 22:15:54 2444

转载 [我们是这样理解语言的-3]神经网络语言模型

[我们是这样理解语言的-3]神经网络语言模型2015/03/15机器学习、自然语言处理Jason Copper1 简介语言模型是自然语言处理领域的基础问题,其在词性标注、句法分析、机器翻译、信息检索等任务中起到了重要作用。简而言之,统计语言模型表示为:在词序列中,给定一个词wt和上下文中所有词wt−1,这个序列出现的概率,如下式,P^(wT1)=∏t=1TP^(wt

2015-08-13 22:14:29 4700

转载 [我们是这样理解语言的-2]统计语言模型

[我们是这样理解语言的-2]统计语言模型2015/02/28搜索技术、自然语言处理LM、n-gram、NLP、统计语言模型、自然语言处理、语言模型fandywang记得最早学习语言模型是在研究生的《统计自然语言处理》课上,由哈工大关毅老师主讲,从噪声信道模型切入,到 N-Gram 语言模型的构建、平滑、评价(KL 距离/相对熵、交叉熵、困惑度),接着以音字转换系统(即拼音输入法

2015-08-13 22:13:41 2017

转载 [我们是这样理解语言的-1]文本分析平台

[我们是这样理解语言的-1]文本分析平台TextMiner2014/06/19搜索技术、自然语言处理、计算广告学LDA、NLP、TextMiner、关键词抽取、文本分类、文本聚类、文本语义分析、自然语言处理fandywang互联网上充斥着大规模、多样化、非结构化的自然语言描述的文本,如何较好的理解这些文本,服务于实际业务系统,如搜索引擎、在线广告、推荐系统、问答系统等, 给我们提出

2015-08-13 22:11:10 1820

转载 转化率预估

[转化率预估-1]引言2014/06/27机器学习、计算广告学star最近几年,“计算广告学”的概念风生水起,让我们这些从事在线广告匹配技术的程序猿着实荣耀了一把。这在参加校园招聘时最有所体会,前几年学生经常问面试官的问题是“你们做网页搜索吗?”,这些年学生更经常问“你们做广告吗,你们做大数据挖掘吗?”。每当这个时候,我的心中就会油然而生满满的幸福感,还要装着没什么的样子回答“当然

2015-08-13 22:09:26 11989

转载 细数广告定向

细数广告定向2014/06/17计算广告学互联网广告、受众定向、广告定向、效果广告、精准投放、计算广告学fandywang广告收入支撑着互联网的大半壁江山,由于互联网广告的存在,用户可以享受到互联网免费提供的聊天、搜索、邮件、资讯、博客/微博、视频、音乐等一站式生活服务。相比传统广告,互联网广告使得企业(广告主)花费更少的钱获取更大的营销推广效果,不至于因“我知道我的广告费浪费了一

2015-08-11 14:46:17 1601

转载 广告定向之再营销

广告定向之再营销2014/08/08计算广告学再营销、定向、广告lorylin什么是再营销广告定向再营销是利用用户在互联网上的行为进行精准定向的广告策略。其中的行为可能包含浏览网页、搜索商品、查看感兴趣的商品信息、将有强烈购买意图的商品放入购物车等等,而“再”的意思则是指将用户感兴趣的商品信息以广告的形式再次展现在他面前。一个典型的再营销场景我们来看下面一个例子

2015-08-11 14:45:07 1169

转载 Peacock:大规模主题模型及其在腾讯业务中的应用

Peacock:大规模主题模型及其在腾讯业务中的应用2015/03/02分布式计算、机器学习、自然语言处理LDA、Peacock、数据并行、模型并行xueminzhaoPeacock:大规模主题模型及其在腾讯业务中的应用作者:赵学敏 王莉峰 王流斌 孙振龙 严浩 靳志辉 王益摘要如果用户最近搜索了“红酒木瓜汤”,那么应该展示什么样的广告呢?从字面上理解,可能应该

2015-08-11 14:35:49 1679

转载 人脸识别(OpenCV+Python)

前言关于opencvOpenCV是Intel开源计算机视觉库(ComputerVersion)。它由一系列C函数和少量 C++类构成,实现了图像处理和计算机视觉方面的很多通用算法。 OpenCV 拥有包括 300 多个C函数的跨平台的中、高层 API。它不依赖于其它的外部库——尽管也可以使用某些外部库。OpenCV 对非商业应用和商业应用都是免费的。同时OpenCV

2015-08-11 14:30:45 2781

转载 python+opencv之视频人脸识别

Python代码import  sys  from  CVtypes  import  cv      def  detect(image):        image_size = cv.GetSize(image)        # create grayscale version       grayscale = cv.CreateIma

2015-08-11 14:30:03 2455

转载 Python-OpenCV人脸检测(代码)

@author:wepon@blog:http://blog.csdn.net/u012162613/article/details/43523507做人脸识别,首先要检测出图片/视频中的人脸,今天就研究了一下OpenCV的Python接口,把常用的一些功能模块写成函数。基于Python-OpenCV以及PIL,实现图片中人脸的检测以及截取保存、眼睛检测、笑脸检测。下面

2015-08-11 14:29:10 593

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除