资源收集:
- 让你的python程序开机自启动
- 编程方式下运行 Scrapy spider–当然可以试试这种方法,虽然我没有尝试过
- Windows开机自启动bat脚本设置方法
- windows环境下配置python脚本的开机启动
step 1: 创建一个文本文档,写入scrapy crawl dmoz
,将后缀改名为bat,并命名为shellbat.bat。
step2:完成爬虫的定时启动的python程序
#!/usr/bin/env python
#coding:utf-8
#time:2015/7/13
#athor:L.P
##############保证windows时间是24小时制########
import os
import time
from datetime import timedelta,datetime
seconds_per_day = 24*60*60
curTime = datetime.now() #现在时刻
print curTime
desTime = curTime.replace(hour=19,minute=57,second=0,microsecond=0) #程序执行时刻
delta = desTime - curTime
skipSeconds = delta.total_seconds()
print 'skipseconds:%d'%skipSeconds
#time.replace([ hour[ , minute[ , second[ , microsecond[ , tzinfo] ] ] ] ] ):创建一个新的时间对象,用参数指定的时、分、秒、微秒代替原有对象中的属性(原有对象仍保持不变)
time.sleep(skipSeconds)
os.system(r"文件路径\shellbat.bat")
将此python脚本生成快捷方式,放入windows菜单下的启动文件下。
C:\Users\Administrator\AppData\Roaming\Microsoft\Windows\Start Menu\Programs\Startup
之后,再重启电脑,即可完成爬虫在我们预定的时间下进行爬取。
ps:当然,电脑是开着的,联着网的~(无奈ing~)