采集的文章中有不想要的链接或图片怎么办?
我们可以使用数据采集器的功能来解决。
例如简数采集器的处理链接或图片功能,可快速选择处理全部图片或链接,也可以单独处理某个位置(前后第几个)的图片或链接,还可以保留前后几张图片。
操作步骤
第一块区域是设置图片处理的,默认是全部保留,可以选择删除所有图片,保留前X张图片,或者保留最后X张图片,还可以指定删除第几张图片,或倒数第几张图片。
第二块区域是设置链接处理的,默认是全部保留,可以选择删除所有链接,或者删除所有链接但是里面的文本或图片保留,还可以指定删除第几个链接,或倒数第几个链接。
只需要采集时设置好,鼠标点击一下即可,十分强大且简答的文章采集器!
最后记得保存,采集文章数据时就会自动处理。
注意:
1. 一般是在正文content字段处设置的,也可以在其他字段设置,但是前提是使用了获取html功能的字段。
2. 注意如果链接无法确定数量,建议还是用处理全部来解决,指定位置的处理可能不通用。