抓取妹子,就是我学习爬虫的动力

使用到的项目

https://github.com/xikong1995/node-crawler

因为项目使用的是nodejs,所以要先安装

nodejs和npm安装

进入官网查看最新版本

https://nodejs.org/en/

node官网

添加源

curl -sL https://deb.nodesource.com/setup_14.x | sudo -E bash -  //数字的地方换成官网上的最新版本

安装

sudo apt-get install -y nodejs

nodejs 和 npm 就安装好了,可以使用 node -vnpm -v查看

妹子图爬取

克隆爬虫

git clone https://github.com/xikong1995/node-crawler.git  //没安装git 可以先使用 apt install git 安装

进入爬虫

cd node-crawler

修改配置文件

微博
vim src/weibo/config.js //打开配置文件

const COOKIE = '这里填写获取到的cookie' //登录微博网页版,然后按 f12 打开调试面板,进入 Network ,刷新下网页,找个链接点开即可看到 cookie

const SCRIPT_URI = '/u/5141494199' 点开你要爬取数据的用户的主页,然后查看浏览器地址栏的域名

或 

const SCRIPT_URI = '/liuyifeiofficial'

微博配置文件

instagram
vim src/instagram/config.js //打开配置文件

const COOKIE = '这里填写获取到的cookie' //登录instagram网页版然后按照上面微博的方式获取获取

const PROXY = '这里填写代理地址'  //咱们如果是在国内服务器运行爬虫的话,爬取instagram需要添加代理才行

const USERNAME = 'riku_riku_99' //这里填写用户名

instagram配置文件

安装项目依赖

npm i  //如果太慢可以使用国内源安装,比如淘宝源 npm i --registry https://registry.npm.taobao.org

开始爬取

npm run dev weibo  //爬取微博

npm run dev instagram //爬取instagram

会在项目src目录下生成对应文件夹 src/weibo/assets/src/instagram/assets/

成品

抓取结果

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值