记录: 小红书笔记采集API 搜索笔记

为了维护公司在小红书平台上的账号数据以及运营分析,需要用到小红书数据采集相关的公开接口进行辅助管理。

近期调研发现iDataRiver平台 https://idatariver.com 上有供应商上架了开箱即用的小红书公开API,可以按需调用。本人简单测试了一下效果还可以,故记录下来以备日后使用。

接口使用详情请参考小红书API文档

https://idatariver.com/zh-cn/project/0eab

接口列表

1. 搜索笔记
参数类型是否必填默认值示例值描述
apikeystringidr_***控制台里复制apikey
querystringiphone搜索词
page_idstring翻页参数
sort_typestring10sort type: 0(综合)

python代码使用requests库请求示例

import requests

# 构建请求URL
# Build request URL
url = "https://apiok.us/api/0eab/search/notes/v1"

# 将apikey替换为自己的
# Replace apikey with yours
params = {
    'apikey': 'idr_***',
    'query': 'iphone',
}

response = requests.get(url, params=params, timeout=60)
data = response.json()

# 打印返回结果
# print response
print(f"Your response is: {data}")

小红书搜索笔记列表接口返回数据样例,也支持搜索小红书用户
小红书搜索笔记列表接口返回数据样例

2. 获取单个笔记详情
参数类型是否必填默认值示例值描述
apikeystringidr_***控制台里复制apikey
note_idstring5b275e5c9374260197ec884a笔记id
3. 获取用户发布的笔记列表
参数类型是否必填默认值示例值描述
apikeystringidr_***控制台里复制apikey
user_idstring55497b8db203d976b714f525用户id
page_idstring翻页参数

还有更多接口这里就省略不记录了…

总结

通过小红书公开数据接口,可高效运营公司运营的账号数据,包括评论监控,关键词等数据运营。

要使用Python通过关键词批量采集小红书笔记的正文、笔记链接、发布时间、点赞数和评论数,你需要利用小红书API进行数据抓取,或者使用爬虫技术进行网页内容的解析。以下是大致的步骤: 1. 分析小红书网页结构:首先,你需要使用浏览器的开发者工具来检查小红书网页的结构,了解如何通过网络请求获取数据,以及所需数据如何在网页中表示。 2. 确定数据来源:如果小红书提供了公开的API,那么使用API接口是最直接和安全的方法。如果API不可用或者限制较大,可能需要使用网络爬虫技术来模拟用户行为抓取数据。 3. 使用合适的库:对于API的数据请求,可以使用Python中的`requests`库来发送网络请求。对于爬虫,可以使用`BeautifulSoup`或`lxml`来解析HTML内容。 4. 编写爬虫脚本:根据你的需求,编写Python脚本来发送关键词查询请求,处理响应数据,并提取出笔记的正文、链接、发布时间、点赞数和评论数。 5. 遵守法律法规和网站政策:在进行数据采集时,要遵守相关法律法规和小红书的使用协议,不要进行大规模的数据抓取,以免对服务器造成不必要的负担。 由于涉及到网络爬虫技术,这里提供一个简单的代码框架示例,用于说明如何使用`requests`和`BeautifulSoup`: ```python import requests from bs4 import BeautifulSoup # 示例:使用假设的API URL和关键词 api_url = 'https://www.xiaohongshu.com/api/search' params = { 'keyword': '你的关键词', 'page': '1', # 其他可能的参数... } # 发送请求 response = requests.get(api_url, params=params) response_json = response.json() # 解析响应内容 for item in response_json.get('items', []): # 提取笔记信息 note_text = item.get('content', '') # 笔记正文 note_url = item.get('url', '') # 笔记链接 # 其他信息... 如发布时间、点赞数、评论数 # 注意:这里的字段名是假设的,需要根据实际API返回的数据结构来获取 print(f'笔记正文: {note_text}') print(f'笔记链接: {note_url}') # 打印其他信息 ```
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值