网络爬虫技术

1、爬虫技术概述 网络爬虫(Web crawler),是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本,它们被广泛用于互联网搜索引擎或其他类似网站,可以自动采集所有其能够访问到的页面内容,以获取或更新这些网站的内容和检索方式。从功能上来讲,爬虫一般分为数据采集,处理,储存三个部分。传...

2019-04-24 17:20:12

阅读数 232

评论数 0

thinkphp3.2 cli模式的正确使用方法(2019-04-08修改)

最近要使用thinkphp3.2版本的cli模式,手动执的话没有问题,比如php /www/index.php home/article/get 这样没有问题,但是一般用cli模式都是定时任务比较多,这个时候写到定时任务的时候,比如 0 * * * * * php /www/index.php h...

2019-04-08 17:20:49

阅读数 61

评论数 0

mysql 获取某个时间段每一天、每一个小时的统计数据

获取每一天的统计数据 做项目的时候需要统对项目日志做分析,其中有一个需求是获取某个给定的时间段内,每一天的日志数据,比如说要获取从2018-02-02 09:18:36到2018-03-05 23:18:36这个时间段内,统计出每一天的日志数据,一般情况下,看到这种需求都是考虑使用函数来搞定,直...

2019-04-08 17:15:35

阅读数 1108

评论数 0

提示
确定要删除当前文章?
取消 删除
关闭
关闭