所用工具 八爪鱼采集器 数据需求 爬取指定关键词下的百度新闻(标题、链接及内容详情) 流程构建 注意:采集数据、设置翻页时,均需修改XPath。翻页循环的设置,可参考八爪鱼采集遇到一二页重复循环的解决办法 - 八爪鱼采集器,但需要根据实际应用而修改!按照链接教程将XPath改为“//A[text()='下一页']”,无用——因百度新闻的下一页实际为“下一页 >”,故应将其改为“//A[text()='下一页 >']”。 使用八爪鱼采集百度新闻 流程图 爬取结果示例 爬取结果示例