python定时杀进程
- 之前写了个python脚本用selenium+phantomjs爬新帖子,在循环拉取页面的过程中,phantomjs总是block住,使用WebDriverWait设置最长等待时间无效。用firefox替换phantomjs无改善
- 因为这个脚本不会长期使用,因此采取临时办法,新开一个子线程固定周期杀死phantomjs进程,这样selenium就会在block最多不超过此周期后返回。当然在爬虫脚本中做一些微调防止部分url被跳过
- 定时执行任务采用sched模块,很多人将其与crontab相提并论
杀死特定进程的命令
kill -9 pid
命令可以无条件终止对应pid进程
获取名为phantomjs的进程pid
- ps命令列出进程信息
- grep过滤得指定名字的进程信息