动态爬虫log示例

path_of_html = "/Users/manmanzhang/Downloads/net_work/analysis_str/pycharm_html.html"
path_of_log = "/Users/manmanzhang/Downloads/net_work/analysis_str/pycharm_headers.log"
url = 'https://oldschool.runescape.wiki/w/A_Doubt'
now = time.time()
respones = requests.get(url)
print(time.time()-now)
log_of_date = format(datetime.datetime.now())
src ='''
    ,respones.text
    ,respones.status_code
    ,respones.reason
    ,respones.headers
    ,respones.cookies
    ,respones.elapsed
    ,respones.history
    ,respones.encoding
    ,respones.content
    ,respones.is_permanent_redirect
    ,respones.is_redirect
    ,respones.links
    ,respones.next
    ,respones.ok
    ,respones.raw
    ,respones.request
    ,respones.__doc__
    ,_module_:respones.__module__
    ,
'''
now = time.time()
code_list = re.findall(r'respones.(.*)\n', src)
log_of_respones = [[code,eval('respones.' + code)] for code in code_list]
print(log_of_respones)
print(time.time()-now)
web = open(path_of_html,'a+')
logs = open(path_of_log,'a+')
for log in log_of_respones:
    if log[0] != 'text':
        web.write(str([url,log_of_date,log])+'\n')
    else:
        logs.write(str([url,log_of_date,log])+'\n')
web.close()
logs.close()
print(time.time()-now)
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值