数据集,3.3万 Instagram Influencer的 1018万条推文数据

一、数据集概况

https://sites.google.com/site/sbkimcv/dataset/instagram-influencer-dataset

作者很nice的,点击 上方链接 给作者留下你的信息,两三天就收到数据集下载链接(谷歌网盘)。

作为 AI for Influencer Marketing 的一部分,我从 Instagram 收集了数据并出于研究目的进行分享。该数据集包含 33,935 位影响者及其 10,180,500 个 Instagram 帖子(每个影响者 300 个帖子)。该数据集包括两种类型的文件:帖子元数据 和 图像文件 。

帖子元数据文件采用 JSON 格式,包含以下信息:标题、用户标签、主题标签、时间戳、赞助、点赞、评论等。图像文件采用 JPEG 格式,数据集包含 12,933,406 个图像文件,因为一篇帖子可以有多个图像文件图像文件。如果一篇文章只有一个图像文件,则 JSON 文件和相应的图像文件具有相同的名称。但是,如果一篇文章包含多个图像,则 JSON 文件和相应的图像文件具有不同的名称。因此,我们还提供了一个 JSON-Image_mapping 文件,该文件显示与帖子元数据对应的图像文件列表。

影响者分为以下九类:

  1. Beauty

  2. Family

  3. Fashion

  4. Fitness

  5. Food

  6. Interior

  7. Pet

  8. Travel

  9. Other

图片


 

二、引用说明

使用  Instagram Influencer Dataset ,  需声明数据来源,

"Multimodal Post Attentive Profiling for Influencer Marketing," Seungbae Kim, Jyun-Yu Jiang, Masaki Nakada, Jinyoung Han and Wei Wang. In Proceedings of The Web Conference (WWW '20), ACM, 2020.

相关链接

文内相关链接

  • 3
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值