Python爬虫
战略运营专家
经济师、注册管理会计师CMA,擅长战略分析、战略规划、经营计划、经营分析、组织绩效管理、流程梳理及优化等,对网络爬虫、大数据分析与挖掘、人工智能具有浓厚兴趣
展开
-
安装Python第三方库的两种方法
安装Python第三方库的两种方法安装Python第三方库的方法,总的来说,可分为自动、手动两种:1、采用pip联网自动下载和安装:在Anaconda Prompt命令窗口中,输入如下命令即可实现联网自动下载和安装:pip install 第三方库名。举例:需安装sklearn库,就输入pip install sklearn。2、手动下载和安装第三方库:常用的方法是在找到第三方库文件(一般以whl为后缀)后,将该库文件下载到电脑上,然后再将库文件复制或剪切到Anaconda Prompt命令窗所原创 2020-12-02 22:53:39 · 719 阅读 · 0 评论 -
修改jupyter notebook的默认文件位置
修改jupyter notebook的默认文件位置安装好Anaconda及jupyter notebook后,打开jupyter notebook会发现显示的是一些文件夹,但具体位置却不清楚。为方便日后的文件编辑及保存,需要修改jupyter notebook的默认文件位置。以下为经过实操验证的详细修改步骤:1、通过Anaconda Prompt命令窗口生成配置文件:在开始菜单里找到并打开Anaconda Prompt,输入如下命令,然后执行:jupyter notebook --generate-原创 2020-12-02 22:09:40 · 417 阅读 · 0 评论 -
使用Selenium模拟谷歌Chrome浏览器时报错怎么办
使用Selenium模拟谷歌Chrome浏览器时报错怎么办对于动态网页的内容爬取,使用selenium模拟谷歌chrome浏览器进行网页操作和内容爬取是很好的一个选择。但在初次使用时,可能会出现报错找不到谷歌浏览器。源代码如下:from selenium import webdriverbrowser=webdriver.Chrome(executable_path=‘D:/anaconda3/chromedriver.exe’)报错信息如下截图所示:出现这种错误时,一般是由于谷歌chrome原创 2020-11-01 22:11:06 · 882 阅读 · 0 评论 -
Python爬取中文内容时乱码怎么办
Python爬取中文内容时乱码怎么办使用Python爬虫爬取一些中文网页的内容时,有时会出现爬取内容为乱码的情况,不管是采用正则表达式还是采用xpath提取内容,结果都一样为乱码,遇到这种问题怎么办?源程序代码如下:import requestsfrom lxml import etreeheaders={‘User-Agent’:‘Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chr原创 2020-11-01 21:24:32 · 2539 阅读 · 4 评论