本代码使用的是python3.x
方法一:通过运行python,自动打开网页,并抓取该网页。
前提:先安装驱动,然后运行即可。详情请查看上一篇文章
import os
from selenium import webdriver
browser = webdriver.Chrome()#打开网页
browser.get("https://einvoice.taobao.com/index?&_emt=1541043729512#/online/invoice/success")
print(browser.page_source) #打印获取的内容
结果:自动弹出浏览器,并输出:
方法二:抓取到网页,保存到本地文件
先抓取文件,然后通过保存网页到本地,同时可以查看文件字节大小
import urllib.request #导入对应的模块
#首先爬取一个网页,并抓取到内容赋值给一个变量
file=urllib.request.urlopen("https://login.taobao.com/member/login.jhtml?f=top&sub=true&redirectURL=http%3A%2F%2Feinvoice.taobao.com%2Findex%3F%26_emt%3D1541043729512