FaceBook爬取库:facebook-scraper

简介

无需注册登录,不需要API秘钥即可爬取Facebook;受twitter-scraper的启发。

安装:

pip install facebook-scraper

使用:

from facebook_scraper import get_posts

# 第一个参数为主页唯一标识:nintendo(https://www.facebook.com/Nintendo/)
# 第二个参数为爬取的页数:1
for post in get_posts('nintendo', pages=1):
    print(post['text'][:50])

输出:

Take a first look at the super cool Puma x Super M
We’re talking Triforce and discussing Hyrule Warri

命令行用法:

$ facebook-scraper --filename nintendo_page_posts.csv --pages 1 nintendo

其他参数解析:

  • group:群组ID,以抓取小组。默认值为None。
  • pages:要请求多少个帖子页面,通常第一页有2个帖子,其余4个。默认值为10。
  • timeout:超时设置。默认值为5。
  • credentials:请求帖子前登录的用户名和密码的元组。默认值为None。
  • extra_info:布尔值,如果为true,则该函数将尝试执行额外的请求以获取后期响应。默认值为False。
  • youtube_dl:布尔,请使用Youtube-DL进行(高质量)视频提取。您需要在您的环境中安装youtube-dl。默认值为False。

请求返回结构实例:

{'post_id': '2257188721032235',
 'text': 'Don’t let this diminutive version of the Hero of Time fool you, '
         'Young Link is just as heroic as his fully grown version! Young Link '
         'joins the Super Smash Bros. series of amiibo figures!',
 'time': datetime.datetime(2019, 4, 29, 12, 0, 1),
 'image': 'https://scontent.flim16-1.fna.fbcdn.net'
          '/v/t1.0-0/cp0/e15/q65/p320x320'
          '/58680860_2257182054366235_1985558733786185728_n.jpg'
          '?_nc_cat=1&_nc_ht=scontent.flim16-1.fna'
          '&oh=31b0ba32ec7886e95a5478c479ba1d38&oe=5D6CDEE4',
 'images': ['https://scontent.flim16-1.fna.fbcdn.net'
          '/v/t1.0-0/cp0/e15/q65/p320x320'
          '/58680860_2257182054366235_1985558733786185728_n.jpg'
          '?_nc_cat=1&_nc_ht=scontent.flim16-1.fna'
          '&oh=31b0ba32ec7886e95a5478c479ba1d38&oe=5D6CDEE4'],
 'likes': 2036,
 'comments': 214,
 'shares': 0,
 'reactions': {'like': 135, 'love': 64, 'haha': 10, 'wow': 4, 'anger': 1},  # if `extra_info` was set
 'post_url': 'https://m.facebook.com/story.php'
             '?story_fbid=2257188721032235&id=119240841493711',
 'link': 'https://bit.ly/something'}

设置代理

代理设置请移步:https://www.xugj520.cn/archives/facebook-scraper.html

  • 2
    点赞
  • 29
    收藏
    觉得还不错? 一键收藏
  • 10
    评论
Python Facebook Scraper是一个用Python编写的工具,用于从Facebook上获取数据。它利用Facebook的公共API,通过网络请求获取用户、页面、帖子等信息。 使用Python Facebook Scraper可以实现以下功能: 1. 用户信息获取:可以获取用户的个人资料、朋友列表、相册照片等信息,并可以进行分析和处理。 2. 页面信息获取:可以获取Facebook页面的基本信息、粉丝数量、发布的帖子等。这对于企业、组织或品牌来说,可以帮助他们分析页面活跃度以及吸引力。 3. 帖子信息获取:可以获取用户或页面发布的帖子的详细信息,包括内容、评论、点赞数等。这对于市场推广、舆情监测等方面有很大的价值。 Python Facebook Scraper的使用方法相对简单,只需要安装相关的Python,并编写相应的代码即可。它提供了丰富的API接口,可以根据需求灵活选择获取的数据类型和条件。 不过需要注意的是,在使用Python Facebook Scraper进行数据获取时,需要遵守Facebook的使用政策,并尊重用户的隐私和数据安全。同时,由于Facebook的API接口经常更新,所以在使用Python Facebook Scraper时,需要持续关注相关的更新和变化,确保代码的稳定性和兼容性。 总之,Python Facebook Scraper是一个功能强大的工具,可以帮助用户从Facebook上获取数据,并进行进一步的处理和分析。它在社交媒体营销、舆情分析等方面有着广泛的应用前景。
评论 10
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值