使用node.js写的爬虫Demo——爬取豆瓣电影Top250

最新推荐文章于 2023-09-23 09:45:23 发布

VIP文章妙木山村民

最新推荐文章于 2023-09-23 09:45:23 发布

阅读量1.5k

点赞数 1

分类专栏： node.js 爬虫文章标签：爬虫 node.js 初级

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_35665506/article/details/82910761

版权

一个用node.js写的爬取豆瓣电影top250的小demo，只爬取了电影名称、电影评分和电影图片，按页分文件夹存储到了本地

一、前言

Domo地址:https://github.com/GitWuJun/NodeDouBanSpider

最近在玩儿node.js,为了实践一下，写了个爬取豆瓣电影top250的小demo。之前用python写过几个简单的爬虫，python爬虫网上教程非常多，而且还有许多优秀的模块和成熟的框架加持，所以还是比较简单。而用node写爬虫相对来说就比较少了，node天生异步io效率非常的高其实还是比较适合写爬虫的，但对于node不熟的新手而言node因为天生优势的效率往往会带来很多的坑。原来只接触过java，对python了解一点，第一次接触node.js这种天生异步io的语言，它的效率的确非常的高，为了防止请求太过频繁或者请求速度过快导致被封ip等问题(目前爬豆瓣的数据还没这个问题)，demo的app2.js中还使用了一个async模块(下面会有介绍)来控制并发数量

二、说明

运行环境:node v8.11.3
使用的模块:url、http/https、cheerios、fs、async

demo主要分为app.js和app2.js,两个文件都可以爬取豆瓣电影top250的所有数据，主要区别在于app2.js中使用了async模块来控制爬取时候的并发数，并通过设置延时来控制爬取速度。
最终会将爬取得到的数据分文件夹保存到本地，包括电影图片和包含电影信息的json格式txt文件。

三、快速开始

Domo地址:https://github.com/GitWuJun/NodeDouBanSpider

git clone [email protected]:GitWuJun/NodeDouBanSpider.git

cd ./NodeDouBanSpider

npm install

node app.js 或者 node app2.js

四、使用了哪些模块

1.url

自带的解析url的模块

最低0.47元/天解锁文章

妙木山村民

关注

1
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
使用node.js写的爬虫Demo——爬取豆瓣电影Top250

一个用node.js写的爬取豆瓣电影top250的小demo，只爬取了电影名称、电影评分和电影图片，按页分文件夹存储到了本地一、前言Domo地址:https://github.com/GitWuJun/NodeDouBanSpider最近在玩儿node.js,为了实践一下，写了个爬取豆瓣电影top250的小demo。之前用python写过几个简单的爬虫，python爬虫网上教程非常多，而...
复制链接

扫一扫

专栏目录

妙木山村民 CSDN认证博客专家 CSDN认证企业博客

码龄8年

3: 原创

151万+: 周排名

170万+: 总排名

4473: 访问

: 等级

76: 积分

0: 粉丝

1: 获赞

2: 评论

11: 收藏

私信

关注

热门文章

分类专栏

vue 1篇
react 1篇
node.js 1篇
爬虫 1篇

最新评论

React与Vue对比学习(一)--基本语法
CSDN-Ada助手: 非常感谢CSDN博主分享的React与Vue对比学习(一)--基本语法，这篇博客非常实用，对于想要学习React和Vue的开发者来说非常有帮助。我觉得下一篇博客可以继续深入探讨React和Vue的特性，比如React和Vue的组件化设计、数据流管理等方面，这样的技术文章对其他用户的学习和开发都有很大的帮助。相信会有更多读者期待你的下一篇博客。为了方便博主创作，提高生产力，CSDN上线了AI写作助手功能，就在创作编辑器右侧哦～（https://mp.csdn.net/edit?utm_source=blog_comment_recall ）诚邀您来加入测评，到此（https://activity.csdn.net/creatActivity?id=10450&utm_source=blog_comment_recall）发布测评文章即可获得「话题勋章」，同时还有机会拿定制奖牌。
Vue项目开发中优雅的切换服务端ip
「已注销」: 博主写得很不错，分享是一种美德。大大的赞！加油。也希望博主坚持写下去。

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。