看了论坛上HTTPClient模拟登陆人人网 的文章,正好今天想注销自己的人人网帐号,又找不到人人网有提供导出日志的功能(超级BS人人网,只提供导入不提供导出),所以想试着用HttpClient做一个,权当练习了。google了一翻,找到了一个python版的导出脚本 ,直接改成了java版的,感谢提供脚本的老杨 。
本来只想写个程序自己导出日志用的,所以代码写的不是很OO,还有改进的余地。有兴趣的朋友可以自我发挥。
导出思路:
1、登录帐号。
2、获得日志首页信息。
3、获得最新一篇日志的地址。
4、获得日志的信息,并转换为xml格式。
5、获得下一篇日志的地址,循环读取日志信息直到最后一篇日志。
6、写入xml文件中。
其中获得日志的信息包括日志的标题,日志的发表日期和日志的内容,通过正则表达式完成。
用到的包,请自行导入:
<classpathentry kind="lib" path="apache-mime4j-0.6.jar"/>
<classpathentry kind="lib" path="commons-codec-1.3.jar"/>
<classpathentry kind="lib" path="commons-logging-1.1.1.jar"/>
<classpathentry kind="lib" path="httpclient-4.0.1.jar"/>
<classpathentry kind="lib" path="httpcore-4.0.1.jar"/>
<classpathentry kind="lib" path="httpmime-4.0.1.jar"/>
<classpathentry kind="lib" path="commons-io-1.4.jar"/>
<classpathentry kind="lib" path="commons-lang-2.3.jar"/>