python
没有腹肌的程序猿
这个作者很懒,什么都没留下…
展开
-
python使用request获取到的页面乱码
解决方式一:response.encoding = response.apparent_encoding。将获取到的页面整体编码进行修改。在此案例中不起效。解决方式二:img_name = img_name.encode(‘iso-8859-1’).decode(‘gbk’)对爬取的逐个进行修改编码。完美解决。...原创 2020-04-04 11:30:18 · 459 阅读 · 0 评论 -
Python爬取药监管理局学习案例
通过抓包分析我们可以发现该页面的数据是动态传输的,也就是通过ajax获取的数据,因此我们可以通过浏览器的控制台获取ajax请求和参数。详情页面也是同样的道理。#药监管理局url = 'http://125.35.6.84:81/xk/itownet/portalAction.do?method=getXkzsList'header = { 'User-Agent':'Mozilla/...原创 2020-03-31 09:28:21 · 2518 阅读 · 4 评论 -
python爬虫之requests(附带四个入门案例)
python爬虫之requestsrequest是python爬虫的一个基本的库,功能十分齐全。下面对一些常用的方法进行说明:(response----指接受返回的响应)requests.get(url,params,headers)url:发送请求的链接。params:携带的参数。headers:头部信息。requests.post(url,data,headers)...原创 2020-03-29 23:20:28 · 15082 阅读 · 5 评论 -
python制作全国疫情追踪系统
新型冠状病毒疫情追踪系统数据来源:使用python爬取腾讯数据。页面:使用python的Flask。图表:使用Echarts。效果图如下:原创 2020-03-20 09:33:56 · 2242 阅读 · 4 评论 -
MAC使用selenium爬虫配置浏览器驱动
No such file or directory: 'chromedriver': 'chromedriver' 错误在终端使用命令:open /usr/local/bin/打开之后将驱动放置在这里面,其他位置无效。原创 2020-03-16 16:55:45 · 713 阅读 · 0 评论 -
Mac启动jupyter命令
python3 -m IPython notebook原创 2020-03-10 11:11:10 · 1997 阅读 · 0 评论