casperjs爬虫总结 -- (3) 抓取百度萝莉吧图片

最新推荐文章于 2021-05-04 22:59:02 发布

扑满大师

最新推荐文章于 2021-05-04 22:59:02 发布

阅读量10w+

点赞数 2

分类专栏： casperjs爬虫文章标签： casperjs

本文链接：https://blog.csdn.net/u013782762/article/details/50389156

版权

本文详细介绍了如何利用casperjs爬虫工具抓取百度萝莉吧中的图片，涵盖了爬虫的基本步骤和技术要点。

摘要由CSDN通过智能技术生成

1 我的casper文件夹结构
|data
--|a.json
--|b.json
|fetch
--|tieba.js
|format
--|tieba.xml
common.js
saveToFile.js

解释:
data文件夹
用来存储爬来的信息,文件格式为json
其中遇到图片信息,一律用base64来储存

fetch文件夹
用来放置针对某个页面的抓取规则
因为我们以后可以要抓取别的网站的信息,而他们的dom结构是不一样的

format文件夹
记录以下dom结构,笔记而已,可以忽略

common.js
一般的casper实例的生成,以及其抓取信息的一般流程

saveToFile.js
把信息保存到data文件夹下

2 common.js(重点解释)
代码以及注释
/*
首先来看下我们的使用方式
casperjs ./casper/common.js --url="http://tieba.baidu.com/f?kw=%D0%A1%C2%DC%C0%F2&fr=index" --category=dino --fetch=tieba
*/

// 生成casper的实例
// verbose默认值为false,即不输出来自phantom的信息(请记住,casper是基于phantom的)
// logLevel表示何种级别输出信息,枚举为debug, inf

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

扑满大师

关注关注

2
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

爬虫 | 少女风萝莉塔，男女玩家都抵抗不了的可爱

zhufureb的博客

01-22

2466

艾瑞巴蒂-小伙伴大家好啊我是铁锅也是湖南刘亦菲上期我们更新完了Python的安装技巧这次我们再更新一下使用爬虫来爬取图片吧和平精英最近新出了一款皮肤粉粉嫩嫩的实在是太好看了吧反正铁锅的少女心都被勾起来了但是，冲动是魔鬼 (还是因为没有钱) 依旧只能爬一爬皮肤，看看图片（嘴巴留下了不争气的泪水）下面就跟大家更新一下如何使用爬虫来爬取网站上的图片代码如下 import requests from lxml import etree # 需要爬取的网址 url = 'https://n

Python人工智能之路 - 第二篇 : 算法实在太难了有现成的直接用吧

weixin_30907935的博客

06-22

296

本节内容预备资料: 1.FFmpeg: 链接：https://pan.baidu.com/s/1jonSAa_TG2XuaJEy3iTmHg 密码：w6hk 2.baidu-aip: pip install baidu-aip 终于进入主题了,此篇是人工智能应用的重点,只用现成的技术不做底层算法,也是让初级程序员快速进入人工智能行业的捷径目前市面上主流的AI技术提供公...

参与评论您还未登录，请先登录后发表或查看评论

unity-导航系统

qq_50682713的博客

05-04

7131

导航系统在使用前要先烘焙拥有静态navigation static的对象会在上面生成根据要求生成可到达以及无法到达的区域，取消勾选该对象，以能够随意地在该对象上移动若想对象完全无法到达，点击那个对象，在导航的对象中找到navigation area，设置为not walkable 通过添加导航网络障碍，来为导航网络添加新的障碍点 NavMeshAgent…SetDestination(Vector3) 设置移动导航目标点 NavMeshAgent.velocity 导航的速度 ...........

Android逆向工程-破解哈皮妹-萝莉

我是传奇

01-26

1181

转载请注明出处：http://blog.csdn.net/singwhatiwanna/article/details/18797493前言新的一年新的开始，除了继续我的原有课题之外，我还打算研究下Android逆向工程的一些东西，主要包括反编译、Smali、APK打包、签名、反逆向和移动安全等。这篇就是新课题的第一篇文章，不过要牺牲下哈皮妹-萝莉这款应用了。通过对哈皮妹-萝莉的破解，让我更加深...

无尽の悲伤

twosecond

05-23

1万+

每一次当我打开落地窗仰望天空的时候我就在想天空是有颜色的它的颜色会随着心情的改变而变化高兴的时候是白色的万里无云一片清明悲伤的时候是深蓝的像一眼望不到边的海很久很久以前想要写一篇文章没有想过怎么开头只是想在最后的地方写一句真是寂寞啊然后跳下高楼化身天使死党丢丢说我的手指像是西伯利亚的坚冰一样冰冷而我的心更是绝对的零度我微笑转过身其实我是面具戴得太久脱不下来了

xxx2xxx转换工具邪恶八进制收集整理上传专用主题(不断更新)https://forum.eviloctal.com/viewthread.php?tid=14426

热门推荐

xu的blog

05-26

11万+

信息来源：邪恶八进制信息安全团队（www.eviloctal.com）以前是使用大压缩包来上传但是发觉其实很不方便第一压缩包体积过大上传更新时间耗费很大第二此外很多的朋友其实只是缺其中几样没必要全部下下来综上所述因此专门开这么一个主题用来不定期更新xxx2xxx类的转换工具考虑到有些朋友需要完整下载原来的主题将保留附件和主题但是将不再更新一切今后的更新以本主题更新为准[转载]x

casperjs-1.1.4-1.zip

06-23

这个"casperjs-1.1.4-1.zip"文件包含了CasperJS的1.1.4-1版本，这是一款非常有用的工具，尤其对于前端开发者和自动化测试工程师来说。 CasperJS的核心功能是模拟用户交互，如点击、滚动、填写表单等，同时它还提供...

brackets-casperjs-code-hinter

07-12

"brackets-casperjs-code-hinter" 是一个专为Brackets编辑器设计的扩展，旨在增强其对CaspeJS的支持。Brackets是一款开源的、轻量级的代码编辑器，尤其受到前端开发者们的喜爱。这款扩展通过提供实时的代码提示和...

casperjs-test-example:CasperJS使用示例进行一些测试

05-15

casperjs-test-example CasperJS使用示例进行一些测试请参阅以下文章： : 运行测试 casperjs test yourtestfile.js # OR to execute all casperjs test * .js 测试用例测试索引要有一些要素文件名：index.js ...

CasperJS-QA-scripts

05-24

CasperJS-QA脚本 404checker-检查404和500个错误的预定义URL ScreenshotUtility-包含2个脚本：screenshots.js-用于获取响应性网页的屏幕快照screenshot-NR.js-用于获取非响应性网页的屏幕截图。您必须指定代理字符...

Opencv+Zbar+二维码识别+摄像头+视频+图片+网络视频多功能识别

05-06

Opencv+Zbar+二维码识别+摄像头+视频+图片+网络视频多功能识别，在其他的资料中做了部分修改，可以直接运行，有详细注释，很好学习，参考资料已经在代码中注明,在原有代码修复了一些小bug，可拍照，视频，网络视频和摄像头识别，也可加载图片

萝莉动态图

02-01

一个动态图开发，简单的gif制作，领用jpg转成gif

播放软件萝莉云-完整版【5.9.2】.rar

06-27

casperjs1.1.0-beta3.jar

06-03

这个"casperjs1.1.0-beta3.jar"文件是CasperJS的一个特定版本，即1.1.0-beta3，适用于Windows操作系统。在Java平台上，JAR（Java Archive）文件用于打包Java类库，方便运行或分发。 CasperJS的核心功能是为Web自动...

不要VIP，想看啥就看啥的在线网站！

cenfeng的博客

06-27

2万+

有句话说得好，我们舍得花300块买衣服，却舍不得掏20块充视频VIP，毕竟充了也不是天天都看，那岂不是亏大发了，出于种种原因，我们有时候不得不做伸手党，诺，手伸出来，我给你啊~ 1. M站一进到网站，发现鼠标指针都变成小萝莉了！喜欢看动漫的小伙伴尤其不容错过，当然除了追番，还有影视区，都是一些经典国外电影，像是哥斯拉，权游第八季都能在线看哦~小编亲测画质不俗哦~ 2. Video...

CreateWindow函数窗体风格dwstyle解析

luoliba007的专栏

05-28

1853

函数原型： HWND CreateWindow(　　LPCTSTR lpClassName,　　LPCTSTR lpWindowName,　　DWORD dwStyle,　　int x,　　int y,　　int nWidth，　　int nHeight，　　HWND hWndParent,　　HMENU hMenu，　　HANDLE hlnstance，　　LPVOID lpParam）；

directshow 无窗模式，可按钮触发截图事件

luoliba007的专栏

09-17

2286

//无窗模式，可按钮触发截图 #include #include #include #include #include #include #include #include #pragma include_alias( "dxtrans.h", "qedit.h" ) #define __IDxtCompositor_INTERFACE_DEFI

刚刚加入博客园的大家庭

luolibai的博客

06-06

160

我是一个才入门的小程序员，在学校就读，加入到程序猿的大家庭。各位前辈多多关照！想问一下怎么赚取积分，获得资源呀！

CasperJS官方文档：测试与网页抓取指南

"casperjs.pdf" 是CasperJS的官方开发文档，主要针对CasperJS的安装、快速启动、命令行使用、选择器、测试功能以及API文档进行了详细阐述。文档内容为英文，适用于对CasperJS感兴趣的开发者，尤其是初学者。 ...