爬虫
fly_boss
这个作者很懒,什么都没留下…
展开
-
python爬虫(一)
简单的爬虫,爬取非诚勿扰的几张图片# -*- coding: utf-8 -*- import urllib import urllib2 import requests import re url="http://tieba.baidu.com/p/4353027288" answer=requests.get(url)._content # 方法二 # answer=urllib2.urlop原创 2016-02-16 16:58:04 · 460 阅读 · 0 评论 -
python爬虫(二)之get请求
构造一个字典,加到url中去。下面举一个例子来找到fly__boss的csdn的# -*- coding: utf-8 -*- import urllib import urllib2 import requests url="http://www.baidu.com/s" my_data={ 'ie':'utf-8', 'f':'8', 'rsv_bp':'1',原创 2016-02-16 16:59:16 · 602 阅读 · 0 评论 -
pathon爬虫(三)之post请求
post一般要比get难,我之前看别人的教程用urllib的库一直搞不定,最后还是换回requests,下面举豆瓣为例(看好多教程都是豆瓣。但是你要是尝试多次后它就会让你输验证码) import urllib import urllib2 import requests import re import cookielib url="http://www.douban.com/accou原创 2016-02-19 16:34:34 · 583 阅读 · 0 评论