python实现网络爬虫学习总结

import urllib2
import urllib

def openUrl(strUrl):
    response = urllib2.urlopen(strUrl)
    retContent = response.read()
    return retContent
    
def writeFile(content, outputPath, mode='w'):
    strInput = ''
    if type(content) != type(""):
        return False
    else:
        f = open(outputPath, mode)
        f.write(content)
        f.close
        return True

'''retUrl = openUrl('')
writeFile(retUrl, 'login.html', 'w')
'''

user_agent = 'Mozilla/4.0 (compatible; MSIE 5.5; Windows NT)'
headers = { 'User-Agent' : user_agent }
url = ''
data = {}
data['uid'] = ''
data['password'] = '
#data['verifyCode'] = '2345'
data = urllib.urlencode(data)
req = urllib2.Request(url, data)
try:
    response = urllib2.urlopen(req)
except urllib2.URLError, e:
    print e.code
    print '=============='
    response = "request error"
if type(response) != type(''):
    the_page = response.read()
else:
    the_page = 'error'
writeFile(the_page, 'postLogin.html')
 
自己写的实例

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值