自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

u012680593的博客

sunshine,你好

  • 博客(3)
  • 收藏
  • 关注

原创 python 爬虫

爬虫之抓取糗事百科的段子(python3.5环境):1.下载页面2.解析(xpath方法)# -*-coding:utf-8 -*-import urllib.requestimport sysimport iofrom lxml import etreefrom urllib.parse import urljoinsys.stdout = io.TextIOWrappe

2016-12-22 19:31:40 542

原创 window7 python 安装 lxml

window7安装lxml1.pip install wheel2.查看当前python环境支持的安装包文件1.输入python2.import pip;print(pip.pep425tags.get_supported())3.显示支持版本4.xml官网下载对应版本安装包:http://www.lfd.uci.edu/~gohlke/pythonlibs/#lxml

2016-12-22 16:25:17 410

原创 python编码问题——解决python3 UnicodeEncodeError: 'gbk' codec can't encode character '\xXX' in position XX

python实现爬虫遇到编码问题:error:UnicodeEncodeError: 'gbk' codec can't encode character '\xXX' in position XX解决办法:改变标准输出添加代码:sys.stdout = io.TextIOWrapper(sys.stdout.buffer,encoding='gb18030') #改变标准输出的默

2016-12-22 14:59:53 27154 4

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除