用浏览器监控采集微信公众号最新文章

     最近单位需要收集多个微信公众号的文章内容,手机上关注无法批量保存和导出文章。找了很久才发现搜狗可以搜索公众号,但每个公众号只显示一条最新的内容。于是就想到了使用软件不断循环监测采集的办法,每次出现新的文章都采集和保存,累积下来就形成完整数据了。没有现成的专用搜索采集软件怎么办,那就找个通用的页面采集软件,于是又找到了木头浏览器,经过不断摸索发现木头浏览器可以自动完成从搜索查询到采集文章标题和内容的全过程,特别整理了操作步骤。
1、先创建一个Excel表格“微信公众号.xlsx”,用来保存所有公众号及其名称,后面让软件自动读取这个文件,如果要增加公众号,也直接添加到这个文件即可。

2、打开木头浏览器,找到【自动控制】菜单,打开【项目管理器】,将弹出项目管理窗口;

3、在项目管理器中,软件已经自动创建了一个“‘默认项目”,在该项目上点击鼠标右键打开快捷菜单,依次选择【新建步骤】、【打开网页】菜单项,新建一个打开网页的步骤,再添加搜狗的网址;

4、新建一个填写内容的步骤,点击【添加】按钮,弹出【添加自动填写项目】对话框,在此对话框中点击【自动获取】按钮,弹出木头浏览器主窗口,将鼠标移到搜索关键词输入框处点击鼠标右键,在弹出的快捷菜单中选择【获取元素并返回】,成功获取关键词输入框的参数,并返回到填写项目设置对话框。

5、获取输入框元素后,设置填写属性为”value",填写内容选择“填写Excel文件内容”,并设置"微信公众号.xlsx"的文件路径,选择该文件的第一个工作表,填写该表“公众号”字段下的内容,最后点击确定关闭对话框。

6、新建一个自动点击步骤,点击【添加】按钮,弹出【添加点击目标】对话框,点击【自动获取】按钮,弹出木头浏览器主窗口,把鼠标移到网页内“搜公众号”的按钮上,点击鼠标右键,选择【获取元素并返回】,成功获取搜索按钮。

7、在网页上手工搜索一个公众号,进入搜索结果页面。然后新建一个监控元素步骤,点击【添加】按钮,打开【添加监控元素】对话框,元素别名改为”最新文章“,点击【自动获取】按钮,弹出木头浏览器主窗口,把鼠标移到网页上的最新文章处点击右键,选择【获取元素并返回】,成功获取最新文章元素。修改监控元素属性为”text",类型为“字符串”,数据比较方式“Change"。意思是网页最新文章文本内容发生变化时报警提醒,并选择该节点下的Yes分支继续执行。

8、选择”Yes"节点修改报警设置,勾选“重复内容不提醒”和“弹出窗口提醒”,在弹窗显示内容输入框中,点击右键可添加监控元素“最新文章”,即直接提醒文章标题。

9、在“Yes"节点下新建”抓取内容“步骤,然后点击【添加】按钮,弹出【动态元素设置】对话框,修改别名为”公众号名称“,点击【自动获取】按钮,在木头浏览器主窗口网页上,找到公众号标题点击右键,选择【获取元素并返回】,获取元素属性名称输入“Text"。

10、以同样的方式,添加抓取最新文章的链接,修改别名为”文章链接“,获取元素属性名称填写”href“。

11、在”Yes"节点下新建一个保存内容的步骤,勾选“保存变量文件”,保存格式选择“Excel文档”,并设定保存文件路径。点击【设置内容】按钮,弹出【查看变量】对话框,选择需要保存到Excel的变量,包括监控元素变量和抓取变量内容。

12、在第一步打开网页后,插入一个定时控制步骤,设置间隔周期30秒运行一次,且不设置停止条件。只要不人工干预停止,将无限循环操作。

13、选择默认项目要节点,点击【开始】按钮,执行项目测试一下。

14、软件自动打开搜狗网页,自动输入公众号名称和点击搜索按钮了,并按设定周期继续查找下一个公众号。遇到最新文章会在屏幕右下角弹出提示窗口,显示最新文章标题及公众号名称。

15、在弹窗报警提醒的同时,木头浏览器已自动将内容保存到excel文档中。如有必要,还可以直接采集文章内容保存到表格中,限于篇幅,此问题留给大家探讨。

  • 2
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 4
    评论
### 回答1: 要从外部的H5页面跳转到微信公众号的关注页面,需要进行以下步骤: 1. 确认微信公众号的原始ID 在微信公众号后台,可以在“设置”-“公众号设置”-“帐号详情”中找到公众号的原始ID。 2. 在外部H5页面上添加关注链接 在外部H5页面上添加一个链接,链接的URL为以下格式: ``` https://mp.weixin.qq.com/mp/profile_ext?action=home&__biz=[公众号的原始ID]#wechat_redirect ``` 请将[公众号的原始ID]替换为你的微信公众号的原始ID。 例如,如果微信公众号的原始ID为“wx123456789”,则链接的URL为: ``` https://mp.weixin.qq.com/mp/profile_ext?action=home&__biz=wx123456789#wechat_redirect ``` 3. 用户点击链接后跳转到微信公众号关注页面 当用户在非微信浏览器上打开外部H5页面,并点击上述链接时,会自动跳转到微信公众号的关注页面。 请注意,用户必须使用微信浏览器打开关注链接才能正常关注公众号。如果用户在非微信浏览器中打开链接,可能无法正常关注公众号。 ### 回答2: 从外部h5非微信浏览器跳转到微信公众号关注页面有以下几种方法: 1. 生成关注链接:在微信公众号平台获取自己的微信公众号关注链接,一般是类似于https://mp.weixin.qq.com/mp/profile_ext?action=home&__biz=XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX==#wechat_redirect的形式。将这个链接嵌入到外部H5页面中,用户点击链接即可跳转到微信公众号关注页面。 2. 使用微信公众号二维码:在微信公众号平台生成一个关注该公众号的二维码,然后将二维码图片插入到外部H5页面中。用户打开外部H5页面后,扫描二维码即可跳转到微信公众号关注页面。 3. 利用微信JSSDK:通过在外部H5页面中引入微信官方提供的JSSDK,在页面中调用微信的相关API,实现跳转到微信公众号关注页面。具体做法是首先通过wx.config进行配置,然后使用wx.ready监听JSSDK配置完成后的事件,最后使用wx.openUrl指定跳转的URL,将其设置为微信公众号的关注链接。 总之,以上是从外部H5非微信浏览器跳转到微信公众号关注页面的几种方法,其中常用的是生成关注链接和使用微信二维码的方式。具体选择哪种方法,可根据实际需求和开发环境来决定。 ### 回答3: 如果要从外部H5非微信浏览器跳转到微信公众号关注页面,可以通过以下几种办法: 1. 生成个人或公众号的二维码:可以在微信公众号后台或者第三方平台上生成一个关注公众号的二维码。在H5页面上将该二维码展示出来,用户可以使用手机扫描二维码,跳转到微信客户端的公众号关注页面。 2. 使用微信授权登录:在H5页面上使用微信的网页授权登录功能,引导用户使用微信账号登录,并获取到用户的openid。在登录成功后,再通过微信JS-SDK的接口,调用相关功能,弹出关注公众号的页面,引导用户关注。 3. 在H5页面中使用微信JS-SDK的接口:可利用微信JS-SDK的相关功能,如打开特定网页、唤起微信扫一扫等。在H5页面上加入一个关注按钮,点击按钮后调用JS-SDK接口,跳转到微信公众号的关注页面。 需要注意的是,以上方法在实际应用中需要满足一些条件,比如需要有正式的微信公众号,需要进行相应的配置,以及需要获取微信JS-SDK的权限等。另外,不同的微信版本和设备可能对跳转行为有一定的限制,因此在操作时要注意兼容性的问题。
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值