我有一个包含通过HTTP加载的登录表单的网页,但它通过HTTPS提交数据.
我使用python-mechanize登录到这个站点,但似乎数据是通过HTTP提交的.
我的代码看起来像这样:
import mechanize
b = mechanize.Browser()
b.open('http://site.com')
form = b.forms().next() # the login form is unnamed...
print form.action # prints "https://login.us.site.com"
form['user'] = "guest"
form['pass'] = "guest"
b.form = form
b.submit()
提交表单时,通过HTTP进行连接,并包含以下内容:
send: 'POST https://login.us.site.com/ HTTP/1.1\r\nAccept-Encoding: identity\r\nContent-Length: 180\r\nHost: login.us.site.com\r\nContent-Type: application/x-www-form-urlencoded\r\n\r\n'...
任何人都可以确认并最终发布解决方案,以便通过HTTPS提交表单?
后来编辑:
1)我正在使用HTTP代理进行http / https流量(在环境中设置 – Linux机器)
2)我已经看过Wireshark的流量,我可以确认流量是通过正常的HTTP发送的(我可以看到POST的内容,机械化不会发送相同的请求作为webbrowser的代理 – 后者发送CONNECT login.us.site.com:443,而机械化只有邮政https://login.us.site.com).但是,我不知道在离开代理时数据发生了什么?也许它建立到目标站点的ssl连接?