python
jerry_fight
这个作者很懒,什么都没留下…
展开
-
beautifulsoup的简单用法
取得html檔在python可以很輕易的用urllib來達成webfile = urllib.urlopen(url)讀取內容可以用webcontext = wefbfile.read()orwebcontext = webfile.read().decode("UTF-8")如果不指定decode方式則以系統預設方式decode交由BeautifulSoup處理转载 2012-02-02 21:45:27 · 9894 阅读 · 0 评论 -
Ubuntu下python的BeautifulSoup和Mechanize安装方法
先安装easy_install工具: 再用easy_install安装:easy_install BeautifulSoupeasy_install Mechanize原创 2012-02-02 15:34:03 · 3972 阅读 · 1 评论 -
Ubuntu下的python的lxml库安装
直接sudo apt-get install python-lxml原创 2012-01-31 14:33:06 · 7196 阅读 · 0 评论 -
python中模拟浏览器的方法和思路
两种思路三种方法:用PAMIE。建议不要使用,因为PAMIE为个人开发,里面的bug比较多,而且是直接使用win32com方式的,如果IE不小心修改了,后果很严重。另外,PAMIE3使用的是Python3,这个在Python世界中支持的不太好。用selenium RC。这个东东很好,如果用这个东东完成网页自动测试不错,支持多种浏览器,而且是公司开发的,上手难易程度类似PAMIE。只不过需要转载 2012-02-05 17:38:08 · 4910 阅读 · 0 评论