记录学习python爬虫遇到的问题

1,urllib

    碰到的第一个问题就是python3不支持urllib.urlope()方法,解决方法是引用urillib.request.urlopen();

2,爬取的网页中文显示x89/x86/x45

   python3输出位串,而不是可读的字符串,需要转化,使用str(string,'ecoding')进行转化就可一解决

3,对urllib中的data参数进行构造

   需要引入urllib下的parse,同时需要记住提交类型不能是string,应该是byte类型。写法:parse.urlencode(data).encode('编码类型')

4,python 报错 typeError:an integer is required (got type dict)

原因:headers不能用urllib.request.urlopen()直接访问,需要先用urllib.request.Request()

5,threading.current_thread()详解

解答:返回当前的线程对象。链接:https://blog.csdn.net/shennongzhaizhu/article/details/51544151

6,多线程:threading.current_thread().name和.getName()有什么区别

解答:name 是当前线程的属性, getName 是当前线程的方法。

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值