![](https://img-blog.csdnimg.cn/20201014180756923.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
爬虫
menglu503
这个作者很懒,什么都没留下…
展开
-
render()方法如何调取chrome浏览器
1、浏览器和浏览器驱动版本匹配下载,具体参见https://www.jianshu.com/p/83388bb1c0d52、chromedriver_win32 放到默认地址下,具体参见https://blog.csdn.net/new_python/article/details/103073143注意事项:1环境变量要配置,驱动要放到浏览器安装目录下2 anaconda scripts文件夹下要放一个chromedriver...原创 2021-03-13 07:07:26 · 234 阅读 · 0 评论 -
获取免费代理池
import requestsfrom lxml import etree #HTML解析模块import pandas as pdip_list = []def get_ip(url,headers):#发送网络i请求requests.DEFAULT_RETRIES = 5s= requests.session()s.keep_alive = Falseresponse = requests.get(url=url, headers=headers, timeout=300, ver原创 2021-03-05 05:29:55 · 147 阅读 · 1 评论 -
jpynb文件转换为word文档,正则表达式去掉jpynb里的格式
jpynb的爬虫语句为了更好的学习,我尝试导出来,网上说的用pandoc转换失败了,无意中看到可以到处为py文件,于是我走了一条不错的路线,记录下来。1:在jupyter notebook 文件中另存为py文件2:用pycharm 打开3:替换选择正则表达式,输入^# In[([1-9][0-9])]:替换为空去掉# in [] :4: 输入^\s\n替换为空格,去掉所有空行这样整个程序看起来都非常干净了...原创 2021-02-22 00:13:34 · 439 阅读 · 0 评论