爬虫基础
程序波
坚持,有耐心,一颗不服输的心
展开
-
爬虫-xpath 匹配
/ 从根标签开始 必须具有严格的父子关系// 从当前标签 后续节点含有即可选出列题import lxml.htmltest_data = """ <div> <ul> <li class="item-0"><a href="link1.html" id=原创 2018-12-20 21:00:19 · 369 阅读 · 0 评论 -
http协议详细简介
HTTP简介HTTP协议是Hyper Text Transfer Protocol(超文本传输协议)的缩写,是用于从万维网(WWW:World Wide Web )服务器传输超文本到本地浏览器的传送协议。HTTP是一个基于TCP/IP通信协议来传递数据(HTML 文件, 图片文件, 查询结果等)。HTTP协议工作于客户端-服务端架构为上。浏览器作为HTTP客户端通过URL向HTTP服务端即W...原创 2018-12-20 22:03:23 · 237 阅读 · 0 评论