在网站页面,按快捷键【Ctrl+U】打开源码页面。
网页一般由三部分组成,分别是 HTML(超文本标记语言)、CSS(层叠样式表)和 JScript(活动脚本语言)。
详细内容见如下参考博文:
http://c.biancheng.net/view/2011.html
在ubuntu下安装requests包:
pip install requests -i http://pypi.douban.com/simple/ --trusted-host pypi.douban.com
Get方式获取网页数据
import requests #导入requests包
url = 'http://www.cntour.cn/'
strhtml = requests.get(url) #Get方式获取网页数据
print(strhtml.text)
用 GET 方式获取数据需要调用 requests 库中的 get 方法。