- 博客(3)
- 收藏
- 关注
原创 python 爬虫
爬虫之抓取糗事百科的段子(python3.5环境):1.下载页面2.解析(xpath方法)# -*-coding:utf-8 -*-import urllib.requestimport sysimport iofrom lxml import etreefrom urllib.parse import urljoinsys.stdout = io.TextIOWrappe
2016-12-22 19:31:40 542
原创 window7 python 安装 lxml
window7安装lxml1.pip install wheel2.查看当前python环境支持的安装包文件1.输入python2.import pip;print(pip.pep425tags.get_supported())3.显示支持版本4.xml官网下载对应版本安装包:http://www.lfd.uci.edu/~gohlke/pythonlibs/#lxml
2016-12-22 16:25:17 410
原创 python编码问题——解决python3 UnicodeEncodeError: 'gbk' codec can't encode character '\xXX' in position XX
python实现爬虫遇到编码问题:error:UnicodeEncodeError: 'gbk' codec can't encode character '\xXX' in position XX解决办法:改变标准输出添加代码:sys.stdout = io.TextIOWrapper(sys.stdout.buffer,encoding='gb18030') #改变标准输出的默
2016-12-22 14:59:53 27154 4
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人