微信爬虫，爬取网页信息（使用代理和模拟浏览器）

最新推荐文章于 2024-04-12 18:45:00 发布

wangxihe2012

最新推荐文章于 2024-04-12 18:45:00 发布

阅读量5.6k

点赞数

分类专栏： Python python网络编程

本文链接：https://blog.csdn.net/wangxihe2012/article/details/80528592

版权

#http://weixin.sogou.com/
import re
import urllib.request
import time
import urllib.error
import urllib.request

import scipy
#自定义函数，功能为使用代理服务器爬一个网址
def use_proxy(proxy_addr,url):
    #建立异常处理机制
    try:
        req=urllib.request.Request(url)
        req.add_header('User-Agent', 'Mozilla/5.0 (Windows NT 6.3; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/66.0.3359.181 Safari/537.36')
        proxy= urllib.request.ProxyHandler({
 'http':proxy_addr})
        opener = urllib.request.build_opener(proxy, urllib.request.HTTPHandler)
        urllib.reque

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

wangxihe2012

关注关注

0
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
微信爬虫，爬取网页信息（使用代理和模拟浏览器）

#http://weixin.sogou.com/import reimport urllib.requestimport timeimport urllib.errorimport urllib.requestimport scipy#自定义函数，功能为使用代理服务器爬一个网址def use_proxy(proxy_addr,url): #建立异常处理机制 tr...
复制链接

扫一扫