爬虫相关
国师的玄兵是什么
这个作者很懒,什么都没留下…
展开
-
request的初步了解
Requests: 让 HTTP 服务人类虽然Python的标准库中 urllib 模块已经包含了平常我们使用的大多数功能,但是它的 API 使用起来让人感觉不太好,而 Requests 自称 “HTTP for Humans”,说明使用更简洁方便。Requests 唯一的一个非转基因的 Python HTTP 库,人类可以安全享用:)Requests 继承了urllib的所有特性。Req...原创 2018-10-28 19:54:29 · 106 阅读 · 0 评论 -
初步了解css
初步了解cssCSS是 Cascading Style Sheets 的首字母缩写,意思是层叠样式表。有了CSS,html中大部分表现样式的标签就废弃不用了,html只负责文档的结构和内容,表现形式完全交给CSS,html文档变得更加简洁。css基本语法css的定义方法是:选择器 { 属性:值; 属性:值; 属性:值;}选择器是将样式和页面元素关联起来的名称,属性是希望设置的样式属性每...原创 2018-10-23 20:12:22 · 99 阅读 · 0 评论 -
css选择器的分类
常用的选择器有如下几种:1、标签选择器标签选择器,此种选择器影响范围大,建议尽量应用在层级选择器中。 举例:*{margin:0;padding:0}div{color:red} <div>....</div> <!-- 对应以上两条样式 --><div class="box">....</div> <!..转载 2018-10-23 20:15:39 · 183 阅读 · 0 评论 -
详解CSS的相对定位和绝对定位
详解CSS的相对定位和绝对定位CSS的相对定位和绝对定位通常情况下,我们元素的position属性的值默认为static 就是没有定位,元素出现在正常的文档流中,,这个时候你给这个元素设置的left,right,bottom,top这些偏移属性都是没有效果的,不会生效,比如你设置一个距离左边距偏移100px的声明:left:100px 那么这条声明不会起到任何效果。还有z-index属性在这...转载 2018-10-24 22:15:11 · 99 阅读 · 0 评论 -
scrapy爬虫selenium模拟无法登陆和爬取的问题
使用selenium模拟浏览器进行数据抓取无疑是当下最通用的数据采集方案,它通吃各种数据加载方式,能够绕过客户JS加密,绕过爬虫检测,绕过签名机制。它的应用,使得许多网站的反采集策略形同虚设。由于selenium不会在HTTP请求数据中留下指纹,因此无法被网站直接识别和拦截。但是selenium在运行的时候会暴露出一些预定义的Javascript变量(特征字符串),例如"window.naviga...原创 2019-01-16 11:28:33 · 1264 阅读 · 0 评论