- 博客(9)
- 收藏
- 关注
原创 python3 Requests库,网络爬虫(下)
添加headers像我们正常使用这段代码爬取知乎代码时,会出现错误。如下: import requests response = requests.get('http://www.zhihu.com/explore') p...
2019-06-19 10:16:08 150
原创 python3 Requests库,网络爬虫(上)
一、什么是RequestsRequests是用python语言编写,基于urllib,采用Apache2 Licensed开源协议的HTTP库。它比urllib更加方便,可以节约我们大量的工作,完全满足HTTP测试需求。一句话——Python实现的简单易用的HTTP库二、安装Requests打开cmd命令行,输入如下代码:pip install requests三、用...
2019-06-18 15:52:10 143
原创 python3 Urllib库基本使用
一、什么是Urllib库?Urllib库是Python自带的一个http请求库,包含以下几个模块:urllib.request 请求模块urllib.error 异常处理模块 urllib.parse url解析模块urllib.robotparser robots.txt解析模块有了Urllib库呢,...
2019-06-18 09:24:53 134
原创 爬虫学习
Python 网络爬虫基础知识什么是爬虫?请求网站并提取数据的自动化程序爬虫的基本流程:1.发起请求:通过HTTP库向目标站点发起请求,即发送一个Request,请求可以包含额外的headers等信息,等待服务器响应。2.获取响应内容:如果服务器能正常响应,会得到一个Response,Response的内容便是所需获取的页面内容,类型可能有HTML,Json字符串,二进制数据等...
2019-06-18 08:41:16 127
原创 使用selenium控制chrome
一、安装selenium包通过cmd安装selenium ,命令如下:pip install selenium二、安装chrome driver根据已安装的chrome版本,安装对应的chromedriver。chromedriver下载网址:http://npm.taobao.org/mirrors/chromedriver/这里特别注意,不同版本的chrome需要安装不同版本的c...
2019-04-25 11:09:14 973
原创 python连接数据库
1.使用pip进行pymysql的安装由于版本原因,python3不支持mysqldb。而python3自带了pymysql,所以我们安装pymysql即可。打开cmd输入如下代码pip install pymysql后就会自动安装了。2.连接数据库安装好后,我们就可以通过import pymysql来进行使用了以下是连接数据库的具体代码import pymysql#创建链接try...
2019-04-22 14:10:32 71
原创 Navicat连接Mysql报错:Client does not support authentication protocol requested by server;
Navicat连接Mysql报错:Client does not support authentication protocol requested by server;新装的MySQL,想用navicat连接,结果发现连接失败,失败原因:Client does not support authentication protocol requested by server;经过查阅资料,找到解决...
2019-04-22 09:27:23 107
原创 MySQL不是内部或外部命令解决方法
MySQL不是内部或外部命令解决方法刚刚安装好MySQL,使用cmd调用时发生错误,提示MySQL不是内部或外部命令。绝大多少的“不是内部或外部命令”的错误都是因为系统环境变量没有设置的,所以只需要将MySQL的安装路径添加到系统环境变量中即可。具体操作如下:找到MySQL的安装路径复制路径。添加到系统环境变量新建之后粘贴保存。重启cmd重启cmd,输入MySQL就可以正常使...
2019-04-22 09:14:11 2003 2
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人