- 博客(4)
- 资源 (1)
- 收藏
- 关注
原创 UnicodeEncodeError: 'gbk' codec can't encode character '\xa0' in position 2...错误
在用scrapy爬取网页数据时,Selector解析网页数据时会出现如题的错误。site.xpath('//table[2]/tr[3]/td[2]/text()').extract()[0]这样写site.xpath('//table[2]/tr[3]/td[2]/text()')打印,是不会报错的。加上extract()就会报这样子的错。因为extract()返回选中内容的Unicode字符串...
2018-05-18 16:45:29 1525
原创 selenium+webdriver+chromedriver爬取百度图片(二)
可以滚动轴往下滑动获取更多图片的代码def scrollBy(index, driver): i = 0 while i <= index: time.sleep(3) driver.execute_script("window.scrollBy(0," + str(1000 * i) + ")") i += 1然后在上一篇中调...
2018-05-18 16:25:35 1241 1
原创 selenium+webdriver+chromedriver爬取百度图片(一)
环境准备:安装selenium,chromedriver,BeautifulSoup建议先安装pip,然后可以直接pip来安装很多相关的插件直接上代码import time import requests from selenium import webdriver from bs4 import BeautifulSoup user_agent = "Mozilla/5.0 (Windows...
2018-05-18 16:21:52 2978
原创 安装pyhton3.4和配置环境变量
介绍:Python的3.0版本,常被称为Python 3000,或简称Py3k。相对于Python的早期版本,这是一个较大的升级。为了不带入过多的累赘,Python 3.0在设计的时候没有考虑向下兼容。下载地址:我的资源_python3.4.4此版本是windows64位的。双击安装。配置环境变量:进入环境变量在选中path编辑在path后面追加python安装的目录地址我安装在C:\Python...
2018-05-18 15:36:30 2933 1
python3.4.4 64位
2018-05-18
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人