python——爬虫
小枍~
暂无
展开
-
html语言初识
1.HTML (超文本标记语言)Hyper Text Markup Language 2.<!DOCTYPE html>全局声明,告诉浏览器现在处理的是HTML文档 文档起点,文档终点 文档头,文档尾(一般被用来设置网页编码,添加网页标签的小logo) 主体头,主体尾(网页窗口内所有内容) <!---->是html注释方式 3.HTML组成: 标签: 标签 含义 <a> 超链接 <button> 定义按钮 <audio&原创 2021-06-01 10:45:57 · 84 阅读 · 0 评论 -
爬虫——初识
1.爬虫目的: 从网上拿到需要的有价值的数据:商业分析,生活助手 2.百度和谷歌:超级爬虫 3.浏览器和服务器之间:先请求,后响应。 浏览器:解析数据 客户端:需要网页 提取数据 存储数据 浏览器工作原理:人、浏览器、服务器三者之间的交流过程 4.爬虫的四个步骤: 获取数据 (向服务器发起请求,然后返回数据) 解析数据(将服务器返回的数据解析成我们能读懂的数据) 提取数据 (爬虫程序从中提取我们需要的数据) 存储数据(将有用数据保存) 5.获取数据: requests库(pip insta原创 2021-05-27 19:50:39 · 93 阅读 · 0 评论