python在哪里写爬虫_第一次写python爬虫

最新推荐文章于 2023-10-06 14:29:34 发布

坚强努力地活下去

最新推荐文章于 2023-10-06 14:29:34 发布

阅读量244

点赞数

文章标签： python在哪里写爬虫

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_26969269/article/details/113510179

版权

花了4天终于把写完了把国内的几个漏洞平台爬完了，第一次写py,之前一直都在说学习，然后这周任务是把国内的漏洞信息爬取一下。花了1天学PY，剩下的1天一个。期间学习到了很多。总结如下：

====================================================================

=====================================================================================================

期间用了几个不错的类库:

urllib2 re chardet sys bs4 BeautifulSoup requests json

比如获取某个标签beautifulsoup，find/findAll/find_all

获取标签的内容XXX.contents[i]

还有AJAX的爬虫：requests.post()期间用了这个方法和别的来爬的时候需要POST，但是一直是GET，纠结了一个晚上，最后问了腾讯某小伙伴解决了问题

只要是data=xxx 都会使用urlencode编码，所以一直是GET

返回的是JSON，如果用字符串处理的话相当麻烦，问了长亭的朋友，推荐用了Json的类库(爬AJAX的时候最好设置个头)

result=requests.post(url,json=payload,headers=headers)

#print result.text

content=json.loads(result.text)

text=content['result']

=========================

apps=json.dumps(j)

app_json=json.loads(apps)

time=app_json['date']

用起来会方便了很多很多，如果需要搞PY爬虫的时候可以尝试下。因为也是刚学，代码只是实现了功能，代码的架构，没有加线程，速度也不是很好，后期可能会去优化。

如果你遇到什么问题，欢迎一起学习，可以发到我的邮箱:sevck#jdsec.com :)

###############

最后说一下，建议别在WINDOWS下写PY，建议LINUX

坚强努力地活下去

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。