自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(3)
  • 收藏
  • 关注

原创 python抓取某代理网站代理IP及端口

#coding:utf8 import httplib from bs4 import BeautifulSoup import re import sys reload(sys) sys.setdefaultencoding('utf-8') ip_L =[] port_L = [] def urlList(): #组成url列表 L = ['/proxy/index.shtml'] fo

2015-09-25 15:23:11 460

原创 python爬虫,抓取百度指定内容的url链接

这并没有什么卵用,我只是拿来练习写的~ #coding:utf8 #获取百度搜索python后 得到网站的url import httplib from bs4 import BeautifulSoup import re def conn(url): nameList = [] connect = httplib.HTTPConnection(url,80,timeout=30)

2015-09-25 15:19:52 1777

原创 关于python里UnicodeEncodeError的问题

今天写爬虫的时候,用BeautifulSoup对文档做处理 html = open('index-1.txt').read() soup = BeautifulSoup(html) print soup.prettify() 发现如果文档中有汉字,当调用prettify方法时,会报错: UnicodeEncodeError: 'ascii' codec can't encode char

2015-09-25 10:46:08 382

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除