自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 问答 (1)
  • 收藏
  • 关注

原创 解决虚拟机VMware中Ubuntu桥接网络/NAT无法连接/网络标志消失的问题

解决虚拟机VMware中Ubuntu桥接网络/NAT无法连接/网络标志消失的问题

2023-04-24 15:54:31 1092 3

原创 createJs+canvas开发h5+接入公众号踩坑

createJs+canvas开发h5+接入公众号踩坑CreateJs预加载音乐播放-soundJs触摸事件图片的缩放/旋转-tweenJS容器的移动帧处理Canvas实现长摁保存图片绘制图片绘制文字接入公众号公众号后台的设置网页授权实现自定义分享链接CreateJs使用CreateJs开发h5 ,坑主要分布在预加载,一系列的事件处理,帧处理等几个方面预加载在载入页面时,为了防止较大的素材载入慢,一般都采用预加载的方式:preloadJs预加载资源中包括音乐时//加载音频文件需要调用如下代码行

2021-06-30 10:43:53 552

原创 记录爬取简书的踩坑过程

记录爬取简书网过程中的坑,利用爬虫中间件解决了xpath无法筛选到作者头像和发布信息这些异步数据的问题

2020-05-17 15:54:49 396 1

原创 爬取拉勾网招聘信息(selenium+lxml)

再次爬取拉勾网招聘信息作学习交流对于上一种爬虫方式,很容易受到网站反爬机制的识别,每一次失效都需要去花时间修改代码,所以可以使用selenium模拟浏览器行为去获取数据,只要拉勾网不把selenium ban掉,理论上就可以一直使用。需要注意的是,代码在模拟浏览器点击下一页的过程中,需要对driver的当前窗口进行切换。附代码:#encoding: utf-8from selenium ...

2020-04-21 00:05:51 900

原创 爬取拉勾网岗位招聘信息(requests+lxml)

记录一种爬取拉勾网的方式作学习交流一般的网站在爬取的时候,使用requests库发出请求,headers里面包括referer和user-agent两项就可以得到正确数据,而拉勾网的反爬机制却可以识别这种简单的爬虫。所以我在未登录的情况下,首先向拉勾网首页发起get请求,将对话信息保存在session,然后用这个session去请求拉勾网传输职位信息的真正的url,就可以成功爬取到职位数据(以p...

2020-04-20 22:11:12 835 2

原创 记录一个爬取电影天堂的爬虫

简单的利用xpath写的爬虫:爬取电影天堂前七页电影的详细信息需要注意的点就是 电影天堂网站的解码方式虽然标注为gbk,但某些字符网站解码也是乱码,在代码中很容易报错,所以直接使用etree.HTML(text)生成对象做处理就好,不用做一些解码操作思路爬取全部电影页面—>获得详细电影页面的url—>爬取详细电影信息界面—>利用xpath数据筛选处理import req...

2020-04-17 23:16:49 684

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除