自己做了个小的开源项目,代号Anaer(Analysis+er)
简单的按照传值要求解析远程页面元素,语言暂时仅支持Java
具体实现是组合调用通过HttpClient和Jericho访问远程页面元素,解析获取元素及其值
使用HttpClient主要考虑到以后会远程证书认证以及Session保持的实现
我现在简单的使用情况觉得Jericho确实比Http Parser易用一些
我将这个开源项目放到GitHub上了,访问下载地址: https://github.com/wuliangcheng/Anaer
现在功能还非常简单,有时间会扩展功能,实现自动登录,证书认证等来获取页面内容
当然,有兴趣的同学欢迎Fork一下,一起实现 :)