Cursor+扣子(Coze):一键爬取公众号文章至多维表格

之前分享过一个一键同步网页内容至飞书多维表格,可以用于打造个人知识库。

缺点是只能一个一个同步。

本期分享批量获取公众号文章,用于搜集热点文章、整理热点关键词。

用到的工具:

  • WeWe RSS:开源项目,通过微信读书抓取公众号历史文章

  • 扣子(Coze):工作流同步文章到飞书多维表格

步骤:

一、WeWe RSS获取公众号文章

github地址:

https://github.com/cooderl/wewe-rss

(本地包关注公众号获取)

  1. 借助Cursor快速部署

  • 安装Docker

官网下载地址:

https://www.docker.com/

Docker的好处是不需要克隆源代码 - 因为所有的程序代码都已经打包在这个 Docker 镜像中了。

我们只需要:

  1. 配置 docker-compose.yml

b. 创建数据目录

c. 运行容器

就可以使用这个服务了。

这也是使用 Docker 的主要优势之一:不需要关心代码和依赖,只需要运行打包好的镜像即可。

Windows系统可能会出现更新失败的问题,一般是缺少补丁。可以在命令行输入以下命令安装补丁。

WSL--updatedocker
  • 使用Cursor快速部署项目 

把github地址扔给Cursor,让它自动部署即可,1分钟搞定。

图片

部署好之后操作:

a. 访问 http://localhost:4000 或者设置的域名

b. 点击"账号管理",添加微信读书账号(需要扫码登录)

c. 进入"公众号源",通过提交公众号文章链接来添加订阅

注意事项:

AUTH_CODE 是API访问的授权码,建议修改为自己的密码SERVER_ORIGIN_URL 如果您要通过外网访问,需要设置为您的公网IP或域名添加公众号时要注意频率,频率过高会被封控需要等24小时如果在国内访问遇到DNS解析问题,可以在环境变量中添加PLATFORM_URL=https://weread.965111.xyz
  • 更新的RSS订阅

图片

二、扣子(Coze)工作流

——解析RSS,写入多维表格

整体流程:

图片

1. 将RSS订阅内容复制到一个新建的飞书云文档中

2. 创建工作流,开始节点输入内容为:飞书云文档链接和要写入的多维表格链接

3. 添加飞书云文档节点:get_document_info (获取文档内容)

图片

图片

获取云文档中的RSS内容

4. 添加大模型节点

图片

提取文章链接,整理成数组格式

5. 添加循环节点

读取文章内容->打标签->整理格式->写入飞书表格

  • 链接读取插件节点:读取链接内容

  • 3个大模型节点:

分别处理不同的事情:

拆解文章:

图片

打标签:

图片

整理格式:

图片

写入多维表格:

图片

### Coze 多维表格功能介绍 #### 表格结构与管理 Coze多维表格允许用户创建复杂的数据库结构来存储和管理数据。通过 `table_id` 参数可以唯一识别每个多维表格中的具体某张表,这使得在复杂的数据环境中定位特定表格变得简单高效[^1]。 #### 数据输入方式 不同于传统的单一输入模式,Coze 支持多种灵活的数据录入途径。除了手动填写外,还可以利用 API 接口实现自动化批量导入导出操作,极大地提高了工作效率并减少了人为错误的发生概率[^3]。 #### 自动化工作流程构建 借助于 Coze 提供的强大脚本编写能力,能够轻松定制个性化的业务逻辑处理机制。例如,在接收到外部触发事件时自动更新指定字段内容;或是当满足一定条件时发送通知提醒相关人员及时跟进事项进展状况等[^2]。 #### 高级查询与分析工具 为了帮助使用者更好地理解和挖掘隐藏在其背后的价值信息,平台内置了一系列强大的数据分析组件。不仅可以执行基本的筛选排序动作,还支持更深层次的关系探索如关联统计图表展示等功能模块。 ```python import requests def fetch_table_data(table_id): url = f"https://api.coze.com/v1/tables/{table_id}/records" headers = { 'Authorization': 'Bearer YOUR_ACCESS_TOKEN', 'Content-Type': 'application/json' } response = requests.get(url, headers=headers) if response.status_code == 200: return response.json() else: raise Exception(f"Failed to retrieve data: {response.text}") ```
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

北洛学Ai

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值