网络爬虫
抓取你看不到的万维网信息
搞点學術的研究生
学而时习之,不亦说乎?
展开
-
网络爬虫之在线获取城市空气质量指数(AQI)源代码
#!/usr/bin/env python#-*- coding:utf-8 -*-'''@author : FIGTHING@file : Air_quality_computing.py@function: Get city air quality information@software: Pycharm@time : 2019/04/03/17:37'''...原创 2019-04-04 16:09:31 · 3494 阅读 · 0 评论 -
《Python3爬虫、数据清洗和可视化实战》之阅读不懂处、主要代码总结(1-4章)
《Python3爬虫、数据清洗和可视化实战》零一 韩要宾 黄园园 著第一章 Python基础1.2 Python操作入门1.2.2 Python基本操作Python通常一行写完一条语句,如果语句很长的话,可以使用反斜杠(\)来实现多行语句。(一般直接换行也可以)1.2.3 变量Python中自带关键字(保留字),任何变量名不能与之相同。(一般变量名命名方式为:所实现功能的英文,再加...原创 2019-05-05 20:57:12 · 2836 阅读 · 0 评论 -
《Python3爬虫、数据清洗和可视化实战》之阅读不懂处、主要代码总结(5-6章)
《Python3爬虫、数据清洗和可视化实战》零一 韩要宾 黄园园 著第五章 Scrapy爬虫5.1 Scrapy简介Scrapy是为了抓取网页数据、提取结构化数据而编写的应用框架。该框架是封装的,包含request、下载器、解析器、twisted等。对于网络内容的爬取,速度非常快。5.3 案例:用Scrapy抓取股票行情爬取过程分为5步:创建爬虫项目;定义一个item容器;定...原创 2019-05-06 22:22:36 · 1098 阅读 · 0 评论 -
《Python3爬虫、数据清洗和可视化实战》之阅读不懂处、主要代码总结(7-8章)
《Python3爬虫、数据清洗和可视化实战》零一 韩要宾 黄园园 著第七章:数据库连接与查询7.1使用PymysqlPython提供了Pymysql库来实现数据库的各种功能。Pymysql库提供两种对象:connect、cursor。Connect对象支持的方法如下:方法说明Cursor()使用该连接创建并返回游标Commit()提交当前事务Ro...原创 2019-05-09 19:54:14 · 616 阅读 · 0 评论 -
《Python3爬虫、数据清洗和可视化实战》之阅读不懂处、主要代码总结(10章)
《Python3爬虫、数据清洗和可视化实战》零一 韩要宾 黄园园 著第十章 综合应用实例实例:按性价比给用户推荐旅游产品第一部分:数据采集import requestsimport jsonimport urllib. Requestimport timeimport csvimport randomfrom selenium import webdriverfrom s...原创 2019-05-17 18:35:08 · 1609 阅读 · 0 评论 -
[WinError 10060]错误
urllib.error.URLError <[WinError 10060] 由于连接放在一段时间后没有正确答复或连接的主机没有反应,连接尝试失败。>在爬虫的时候会遇到上图中出现的问题,百度了好多资料还是没有一个客观的结果。查看自己的代码没有问题,却总是解决不了,有时改变某个参数又会正常运行。经过笔者的百般尝试,终于解决了这个问题!!!对于这种错误的原因有一下几种:你的请求...原创 2019-08-28 10:31:14 · 13599 阅读 · 6 评论