两种思路三种方法:
另外的思路就是利用urllib2来访问网页了。说实在话,选择python的理由有两个:google在用,另外它访问网页和正则表达式的方法让我很喜欢。最后的理由就是她是一个高生产力语言,用C写上200行代码可能用python写5行不到。
使用python的另外的好处是资源相对比较多,要解决一个问题,耐心的查找一下,总能发现好的资源。
- 用PAMIE。建议不要使用,因为PAMIE为个人开发,里面的bug比较多,而且是直接使用win32com方式的,如果IE不小心修改了,后果很严重。另外,PAMIE3使用的是Python3,这个在Python世界中支持的不太好。
- 用selenium RC。这个东东很好,如果用这个东东完成网页自动测试不错,支持多种浏览器,而且是公司开发的,上手难易程度类似PAMIE。只不过需要打开浏览器,这个就看大家的需要了。
- 用Mechanize和Beautiful Soup。这个东东是在urllib2的基础上向上开发的,是个好工具。IBM介绍使用Mechanize的文章
另外的思路就是利用urllib2来访问网页了。说实在话,选择python的理由有两个:google在用,另外它访问网页和正则表达式的方法让我很喜欢。最后的理由就是她是一个高生产力语言,用C写上200行代码可能用python写5行不到。
使用python的另外的好处是资源相对比较多,要解决一个问题,耐心的查找一下,总能发现好的资源。