新手自学首先使用postman制作一个超级的简单的爬虫
目的是为了学会软件的基本操作, postman和pyCharm这两个软件
首先随便打开一个页面
https://www.hao123.com/mid?from=shoubai&key=9298885133730194202&type=rec
右击检查找到network>preserve log>disable>Dos

coy as url(bash)复制里面的链接
然后在通过postman在import
如图

然后就是code出来导入到pycharm
pycharm里面选择好存放路径和系统匹配好的python路径
新建一个python flie
但是缺少一个ruquests模块modu ,http请求模块


所以需要自己添加modu才可以,怎么添加呢?
需要在pycharm的做下角有个terminal 中输入 pip install requests -i https://pypi.doubanio.com/simple即可。
下载下来再run里面会显示xxx的乱码 所限就先把 .encode('utf8‘)删除掉,在run一下就成功打印出html代码了。
本教程为新手提供了一种使用Postman抓取网页数据并利用PyCharm进行处理的方法。通过实际操作,读者将学会如何在Postman中捕获请求,导入到PyCharm,并解决缺少requests模块的问题。
708

被折叠的 条评论
为什么被折叠?



