- 博客(2)
- 资源 (3)
- 收藏
- 关注
原创 php无需设置规则,抓取网页主要内容的实现
在网上经常看到一些网页采集方案,,但总绕不过采集规则的设置,每抓取一种类型的网页需要设置一种规则。。用这些规则进行替换,正则,踢除等操作,,然后取出页面的内容。。 有没有一种好的方法,不用我们为每一种类型的网页书写规则呢?? 下面就来讨论这个问题:: 比如我们抓取新浪新闻的内容,我们看到每个新闻内容那一块,代码基本是整个网页里面字符数最多的,如果我们把这一块代码取出来,不就达到我们的目...
2010-10-21 12:02:51 149
原创 仿csdn,2周不用登录功能碰到的bug
最近做了一个网站http://yichao123.com 需要实现csdn的2周不用登录功能,请参看网站(http://yichao123.com),(在此站登录页面有个选项“两周内不用登录”)。 此站的这个功能用到cookie。。 一开始我直接在首页index.php里面插入自动登录的代码,用cookie 记录登录密码,用户名,,都经过加密。。 可是发现获取cookie必须刷...
2010-10-19 14:59:29 128
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人