- 博客(16)
- 资源 (6)
- 收藏
- 关注
转载 正则表达式之--贪婪与非贪婪模式详解
1. 概述贪婪与非贪婪模式影响的是被量词修饰的子表达式的匹配行为,贪婪模式在整个表达式匹配成功的前提下,尽可能多的匹配,而非贪婪模式在整个表达式匹配成功的前提下,尽可能少的匹配。非贪婪模式只被部分NFA引擎所支持。属于贪婪模式的量词,也叫做匹配优先量词,包括:“{m,n}”、“{m,}”、“?”、“*”和“+”。在一些使用NFA引擎的语言中,在匹配优先量词后加上“?
2013-08-30 11:10:56 797
原创 正则表达式贪婪模式
一、贪婪与非贪婪什么叫贪婪,比如说要从字符串中面包一面包二吃面包,本来你只可以吃面包一,可是你贪心,于是就把第一个到最后一个里面的两个面包取出来了,你想多吃点,非贪婪也就是你不贪吃了,就只吃面包一。我们来看看正则里面是怎么贪婪的php$str = '面包一面包二';preg_match('/(.*)/',$str,$res);print_r($res);
2013-08-30 10:57:41 635
原创 正则表达式
常用的元字符(Meta-character):元字符 说明 \A 匹配字符串串首的原子 \Z 匹配字符串串尾的原子 \b 匹配单词的边界 /\bis/ 匹配头为is的字符串 /is\b/ 匹配尾为is的字符串 /\bis\b/ 定界 \B 匹配除单词边界之外的任意字符 /\Bis/ 匹配单词
2013-08-30 10:38:55 466
原创 采集与防采集
1.网站服务器判断访问者是否是浏览器,如果不是浏览器,就禁止他们访问!(163.com应用了这个技术) 采集方法:fopen file_get_contents fsocket CURL 模拟浏览器访问即可 2.限制IP地址单位时间的访问次数 分析:没有哪个常人一秒钟内能访问相同网站5次,除非是程序访问,而有这种喜好的,就剩下搜索引擎爬虫和讨厌的采集器了。弊端
2013-08-29 10:43:53 957
原创 PHP采集防IP
其实常用的有三种:伪造来源、伪造ip、再者就是用代理。这三种方法curl都可以办到:php//第一、伪造来源HTTP_REFERER$ch = curl_init(); //初始化curl_setopt($ch, CURLOPT_URL, http://www.example.com/); //你要访问的页面curl_setopt($ch, CURLOPT_REFERER, http:
2013-08-29 10:14:00 583
转载 Snoopy采集类
Snoopy是一个php类,用来模拟浏览器的功能,可以获取网页内容,发送表单。Snoopy正确运行需要你的服务器的PHP版本在4以上,并且支持PCRE(Perl Compatible Regular Expressions),基本的LAMP服务都支持。一、Snoopy的一些特点: 1.抓取网页的内容 fetch 2.抓取网页的文本内容 (去除HTML标签) fetchtext
2013-08-28 17:04:24 553
原创 弹出居中层
#bg{ width:100%; height:100%; position:fixed!important;/*FF IE7*/ position:absolute;/*IE6*/ top:0; left:0; filter:alpha(opacity=80);/*IE*/ opacity:0.8;/*FF*/ backgrou
2013-08-23 11:36:49 496
转载 Postfix搭建邮件服务器
1. 邮件服务器基本原理 MUA:邮件用户代理,供用户写信、读信、寄信 MTA:邮件传输代理,接收、递送邮件 MDA:邮件投递代理,投递本地邮件到适当的邮箱 SMTP:简单邮件传输协议,寄信协议 POP3:邮局协议第3版,用户把邮件从服务器上剪切回来,收信协议 IMAP4:因特网消息访问协议第4版,用户把邮件从服务
2013-08-15 14:52:03 1126
转载 判断浏览器
参考页面http://design2u.me/blog/504/html-css-php-javascript-jsp-to-judge-the-users-browser-versionHTML-[if IE 6]>僅IE6可識別 -[if lte IE 6]> IE6及其以下版本可識別-[if lt IE 6]> IE6以下版本可識別-[if gte
2013-08-15 10:05:58 558
转载 [原创] jQuery源码分析-02正则表达式-RegExp-常用正则表达
Js代码 作者:nuysoft/JS攻城师/高云 QQ:47214707 EMail:[email protected] 声明:本文为原创文章,如需转载,请注明来源并保留原文链接。 后文预告:jQuery中的正则表达式分析 作者:nuysoft/JS攻城师/高云 QQ:47214707 EMail:[email protected] 声明:本文为原创
2013-08-05 14:03:56 560
转载 完整的发邮件函数
function smail($smtp,$title,$username,$passwd,$mailfrom,$mailfrom1,$rcptto,$mail){ $message=""; $message .= "正在连接服务器..."; $link = fsockopen($smtp,25); if ($link){ set_sock
2013-08-02 10:21:25 611
转载 PHP抓取页面的几种方式
我们在开发网络程序时,往往需要抓取非本地文件,一般情况下都是利用php模拟浏览器的访问,通过http请求访问url地址, 然后得到html源代码或者xml数据,得到数据我们不能直接输出,往往需要对内容进行提取,然后再进行格式化,以更加友好的方式显现出来。下面简单说一下php抓取页面的几种方法及原理:一、 PHP抓取页面的主要方法:1. file()函数
2013-08-01 16:15:47 603
转载 PHP fsockopen函数详解
fsockopen(主机名称,端口号码,错误号的接受变量,错误提示的接受变量,超时时间)主机名称就是你需要发送数据的目的地;端口号就是这个目的程序会在哪个端口等着你的数据;错误号的接受变量,这个是如果建立socket不成功的时候返回的错误编号;错误提示的变量,是错误的时候返回的错误提示信息;超时时间,就是post数据之后如果对方没有回应信息,等待的最长时间。
2013-08-01 16:13:31 4546
转载 PHP的fsockopen方式访问接口慢的原因与优化方案
在开发过程中常常遇到这样的需求,模拟浏览器访问某接口,并获取返回数据。我们比较常使用的方法是fsockopen与接口建立连接,然后发出指令,然后通过fgets接受返回值。但是我们发现,通过PHP模拟访问接口往往比浏览器访问同样的接口慢很多。这个问题困扰过我很久,今天终于找到原因了。我看网上很多朋友有同样的问题,分享出来供大家参考。我们常常写这样的代码:while(!feof
2013-08-01 16:12:55 4662
转载 PHP利用fsockopen POST HTTP请求(URL)并获取返回值
$srv_ip = '192.168.1.5';//你的目标服务地址. $srv_port = 80;//端口 $url = 'http://localhost/fsock.php'; //接收你post的URL具体地址 $fp = ''; $errno = 0;//错误处理 $errstr = '';//错误处理 $timeout = 10;//多久没有连上就中断
2013-08-01 16:11:46 5724
转载 stream_set_blocking让程序无阻塞
0是非阻塞,1是阻塞阻塞的意义是什么呢?某个函数读取一个网络流,当没有未读取字节的时候,程序该怎么办?是一直等待,直到下一个未读取的字节的出现,还是立即告诉调用者当前没有新内容?前者是阻塞的,后者是非阻塞的。阻塞的好处是,排除其它非正常因素,阻塞的是按顺序执行的同步的读取。借用小说里的说法就是“神刀出鞘,无血不归”。在读到新内容之前,它不会往下走,什么别的事情都不做。而
2013-08-01 16:10:23 768
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人