[Python]网络爬虫获取CSDN博客访问次数

# pip install builtwith
# pip install python-whois
# -*- coding: utf-8 -*-  


import urllib.request
import time
import re

# 寻找网站所有者
# print(whois.whois('https://blog.csdn.net/xeonmm1')) 

# 下载网页
web_data = urllib.request.urlopen('https://blog.csdn.net/xeonmm1')
f = open('website_content.txt', 'w')
k = str(web_data.read().decode('utf-8'))
k = k.replace('\xa0','')
k = k.replace('\u0192','')

# 正则表达式子抓取访问量
b = re.search(r'<dt>访问:</dt>\n(\s*)<dd title="(\d*)',k).group(0)
b = re.search(r'\d+',b).group(0)
b = '访问:'+b
print(b)
f.write(k)
f.close()

# 记录每日访问次数
f = open('website_visit_time.txt', 'a+')
localtime = time.asctime( time.localtime(time.time()))
f.write(localtime)
f.write('\n')
f.write(b)
f.write('\n')
f.close()

print('Program Done')

结果:

website_visit_time.txt:

 

 

  • 2
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值