python自动填写网页数据并提交_自动提交和抓取网页python

自动提交和抓取网页python

时间:2009-08-06 23:38来源:未知 作者:yzhxiang 点击:次

import urllib import urllib2 import

urlparse import lxml.html def url_with_query(url, values): parts =

urlparse.urlparse(url) rest, (query, frag) = parts[:-2], parts[-2:]

return urlparse.urlunparse(rest + (urllib.urlencode(values), None)) d

import urllib

import urllib2

import urlparse

import lxml.html

def url_with_query(url, values):

parts = urlparse.urlparse(url)

rest, (query, frag) = parts[:-2], parts[-2:]

return urlparse.urlunparse(rest + (urllib.urlencode(values), None))

def make_open_http():

opener = urllib2.build_opener(urllib2.HTTPCookieProcessor())

opener.addheaders = [] # pretend we're a human -- don't do this

def open_http(method, url, values={}):

if method == "POST":

return opener.open(url, urllib.urlencode(values))

else:

return opener.open(url_with_query(url, values))

return open_http

open_http = make_open_http()

tree = lxml.html.fromstring(open_http("GET", "http://www.jb51.net").read())

form = tree.forms[0]

form.fields["q"] = "eplussoft"

form.action="http://www.jb51.net/search"

response = lxml.html.submit_form(form,open_http=open_http)

html = response.read()

doc = lxml.html.fromstring(html)

lxml.html.open_in_browser(doc)

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值