自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(10)
  • 资源 (1)
  • 收藏
  • 关注

原创 前端高频面试题(15K级别)

1.简单描述一下 Babel 的编译过程?首先,Babel的作用是 从一种源码到另一种源码,充当转换编译器的作用,可以简述为 解析(解析JS代码)->转换(解析和修改AST)->重建(将修改后的AST转换成另一种JS代码)2.JavaScript 中的数组和函数在内存中是如何存储的?数组,JS里的数组主要就是 以连续内存形式存储的FixedArray、以哈希表形式存储的HashTable函数,函数属于引用数据类型,存储在堆中,在栈内存中只是存了一个地址来表示对堆内存中的引用。当解

2021-07-23 23:07:52 2557 1

原创 爬虫_Day 6 学习requests库这一篇文章足够

目录requests安装 requests使用get请求 requests伪装头信息 requests使用ip代理 request使用post请求 request设置超时参数 request忽略ssl证书验证 requests携带cookies请求 并利用selenium获取cookies1.安装在ubuntu中 Ctrl+Alt+T 进入终端,输入...

2020-04-19 18:42:28 305

原创 爬虫_Day 5 当你斗图失败后又被封了ip啥感受

昨天跟女朋友斗图被狠狠挖苦了一番额…… 那都不重要于是想起来,老子最近学了爬虫你很开心准备去安排她一波我们准备下手的网站http://www.adoutu.com突然发现可以进行搜索那我们就找“装逼”的相关图片https://www.doutula.com/search?key...

2020-04-19 18:41:33 199

原创 爬虫_Day 1 正则表达式

当我开始对爬虫下手的时候心情是这样的信心满满打开了教程,,看到第一节“正则表达式”md 不会正则表达式学么爬虫!!!盘他!正则表达式是干啥用的,简单的讲就是需要在众多的信息中过滤出来自己需要的信息我整了张表,请看表一:通用字符import re# 导包string = "I like python 2020_3_21"# 定义演示字...

2020-04-19 18:40:06 154 1

原创 爬虫_Day 4 听说有个叫selenium的库可以解放双手 wandou

这几天已经被网课快逼疯了课程不仅枯燥时间还长于是决定在安排他一波实现自动点击以及答题开开电脑刷就完了打会王者他不香吗于是今天的主角就是selenium 配合Google Chrome分享一个插件Katalon Recorder这个插件可以实现录制然后翻译出py代码是不是很爽说实话这个库,纯是为了偷懒才发现的开始装逼了需要自己安装一下p...

2020-04-19 18:34:06 290

原创 爬虫_Day 3 伪装请求头

上次成功的爬取到了纵横中文网24小时热销排行榜他是没有反爬机制的所以我们很顺利就获取到 l但是遇到反爬怎么办,我们也丝毫不慌我们就来伪装一下他的“头部”这次我们使用豆瓣来测试一下首先我们用python访问一下import urllib.requesturl = "https://www.douban.com/"respinse = urllib.req...

2020-04-19 18:33:04 461

原创 爬虫_Day 2 urllib 模块实战

DuangDuangDuang上个笔记说了正则表达式这次实战一下还有urllib模块这次来爬“纵横中文网”24小时畅销榜名单经过一顿装逼后 不 操作成功怎么搞的呢首先,介绍一个模块“urllib”"""这个模块主要记住三个模块(有5个的): 1、request:用于访问读取url(主讲) 先说这几个函数:urlopen() info() ge...

2020-04-19 18:30:50 138

原创 Ubuntu系统中使用Firefox浏览器提示代理服务器拒绝连接

今天换了一下局域网的ip,打开电脑发现在Ubuntu系统中使用Firefox浏览器要是出现这个情况我们可以打开’首选项’然后划到最后网络设置刷新一下即可解决问题...

2020-04-10 17:02:26 1877

原创 ubuntu 系统 selenium+webdriver安装

Firefox为例首先我们需要下载一下selenium终端中输入pip --default-timeout=100 install selenium不建议使用国内的镜像源,导入的时候会报错然后下载geckodriver各版本geckodriver下载好了之后进行解压tar zxvf geckodriver-v0.22.0-linux64.tar.gz解压好了将解压的文件mv到...

2020-04-06 17:43:17 851

原创 UnicodeEncodeError: ‘ascii’ codec can’t encode characters in position 21-23: ordinal not in range(12

今天本打算爬一个斗图网站在做个微信机器人,却被网址中存在中文问题难道报错:UnicodeEncodeError: ‘ascii’ codec can’t encode characters in position 21-23: ordinal not in range(128)百度一番 全都是 python2的解决把办法比如:import sysreload(sys) sys.setd...

2020-03-31 20:27:54 349

selenium笔记.md

安装、定位元素、显式等待、隐式等待、WebDriverWait()类、expected_conditions()类、鼠标操作、键盘操作、插入js代码、chrome options参数

2020-05-12

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除