爬虫相关（一）遇到的几个小问题

最新推荐文章于 2022-04-09 20:22:48 发布

weixin_49076046

最新推荐文章于 2022-04-09 20:22:48 发布

阅读量102

点赞数 1

文章标签： python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_49076046/article/details/109841456

版权

问题1：
在这里插入图片描述
解决：
bs 直接BeautifulSoup(response.text)这个没问题
读取文件时要：BeautifulSoup(open(“pachong.html”,encoding="utf-8))

问题2：
在这里插入图片描述
解决：.string 对于复杂结构的标签会返回空

问题3：

解决：params要完整

问题4：
a = []
a = a.append([1,2,3])
错误，不能赋值，返回nonetype
解决：a.append([1,2,3])
正确
问题5:
jupyter 运行代码一直是星号：
解决：
1，重启kenel and run all
2.response 没反应的话，可能网站本身连不上
问题6：
xpath 按类取标签为空
解决：当标签是多个类属性时，多个类都要@class=" 多个类 "
问题7：
解决：full_url_list =[( ‘https:’ + i ) for i in url_list] 不要忘记加[]
问题8：
response.text中文乱码问题
解决：
response = requests.get（。。。)
response.encoding = ‘utf-8’

weixin_49076046

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
爬虫相关（一）遇到的几个小问题

bs 直接BeautifulSoup(response.text)这个没问题读取文件时要：BeautifulSoup(open(“pachong.html”,encoding="utf-8))
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。