今天思考了jsoup的网页监控可行性,思路是jsoup 对比elements 的变动,
分析源码element的对比 使用了object equal (没有重写)
对比的是内存地址,HashCode
因此无法通过elements 的对比来实现网页监测,
启发式设计:对于网页埋点,选择一个网页的特征字符进行监测,多个维度,代码量多
监测设计的目标是 对比网页结构是否发生变化,动态数值发生变化则忽略
还有一种监测思路是监测初步解析结果,是否符合
今天思考了jsoup的网页监控可行性,思路是jsoup 对比elements 的变动,
分析源码element的对比 使用了object equal (没有重写)
对比的是内存地址,HashCode
因此无法通过elements 的对比来实现网页监测,
启发式设计:对于网页埋点,选择一个网页的特征字符进行监测,多个维度,代码量多
监测设计的目标是 对比网页结构是否发生变化,动态数值发生变化则忽略
还有一种监测思路是监测初步解析结果,是否符合
转载于:https://my.oschina.net/PagodaTree/blog/967887