之前分享过一个一键同步网页内容至飞书多维表格,可以用于打造个人知识库。
缺点是只能一个一个同步。
本期分享批量获取公众号文章,用于搜集热点文章、整理热点关键词。
用到的工具:
-
WeWe RSS:开源项目,通过微信读书抓取公众号历史文章
-
扣子(Coze):工作流同步文章到飞书多维表格
步骤:
一、WeWe RSS获取公众号文章
github地址:
https://github.com/cooderl/wewe-rss
(本地包关注公众号获取)
-
借助Cursor快速部署
-
安装Docker
官网下载地址:
https://www.docker.com/
Docker的好处是不需要克隆源代码 - 因为所有的程序代码都已经打包在这个 Docker 镜像中了。
我们只需要:
-
配置 docker-compose.yml
b. 创建数据目录
c. 运行容器
就可以使用这个服务了。
这也是使用 Docker 的主要优势之一:不需要关心代码和依赖,只需要运行打包好的镜像即可。
Windows系统可能会出现更新失败的问题,一般是缺少补丁。可以在命令行输入以下命令安装补丁。
WSL--updatedocker
-
使用Cursor快速部署项目
把github地址扔给Cursor,让它自动部署即可,1分钟搞定。
部署好之后操作:
a. 访问 http://localhost:4000 或者设置的域名
b. 点击"账号管理",添加微信读书账号(需要扫码登录)
c. 进入"公众号源",通过提交公众号文章链接来添加订阅
注意事项:
AUTH_CODE 是API访问的授权码,建议修改为自己的密码
SERVER_ORIGIN_URL 如果您要通过外网访问,需要设置为您的公网IP或域名
添加公众号时要注意频率,频率过高会被封控需要等24小时
如果在国内访问遇到DNS解析问题,可以在环境变量中添加
PLATFORM_URL=https://weread.965111.xyz
-
更新的RSS订阅
二、扣子(Coze)工作流
——解析RSS,写入多维表格
整体流程:
1. 将RSS订阅内容复制到一个新建的飞书云文档中
2. 创建工作流,开始节点输入内容为:飞书云文档链接和要写入的多维表格链接
3. 添加飞书云文档节点:get_document_info (获取文档内容)
获取云文档中的RSS内容
4. 添加大模型节点
提取文章链接,整理成数组格式
5. 添加循环节点
读取文章内容->打标签->整理格式->写入飞书表格
-
链接读取插件节点:读取链接内容
-
3个大模型节点:
分别处理不同的事情:
拆解文章:
打标签:
整理格式:
写入多维表格: