【python】
sunshine0625
只要每天不在原地,就好
展开
-
python正则表达式(关于re)
Python的正则表达式 import re 一、匹配单个字符 .(匹配任意字符除了\n) ma=re.match(r'{.}','a') ma.group() ---结果为:a ma=re.match(r'{...}','abc') ma.group() ---结果为:abc [...](原创 2016-03-29 18:55:23 · 444 阅读 · 0 评论 -
python爬虫之抓取网页中的图片到本地
最近开始学习python,python的爬虫诱惑力实在太强。今天看着网上的教程,也学会了这样一个小功能 主要步骤是: 1.抓取网页 2.获取图片地址 3.抓取图片内容并保存到本地 下面是关键代码: import urllib.request req=urllib.request.urlopen('http://www.imooc.com/course/list') bu原创 2016-03-26 20:02:29 · 15465 阅读 · 7 评论 -
python编码问题——解决python3 UnicodeEncodeError: 'gbk' codec can't encode character '\xXX' in position XX
python实现爬虫遇到编码问题: error:UnicodeEncodeError: 'gbk' codec can't encode character '\xXX' in position XX 解决办法:改变标准输出 添加代码: sys.stdout = io.TextIOWrapper(sys.stdout.buffer,encoding='gb18030') #改变标准输出的默原创 2016-12-22 14:59:53 · 27136 阅读 · 4 评论 -
window7 python 安装 lxml
window7安装lxml 1.pip install wheel 2.查看当前python环境支持的安装包文件 1.输入python 2.import pip;print(pip.pep425tags.get_supported()) 3.显示支持版本 4.xml官网下载对应版本安装包:http://www.lfd.uci.edu/~gohlke/pythonlibs/#lxml原创 2016-12-22 16:25:17 · 404 阅读 · 0 评论 -
python 爬虫
爬虫之抓取糗事百科的段子(python3.5环境): 1.下载页面 2.解析(xpath方法) # -*-coding:utf-8 -*- import urllib.request import sys import io from lxml import etree from urllib.parse import urljoin sys.stdout = io.TextIOWrappe原创 2016-12-22 19:31:40 · 529 阅读 · 0 评论