linux环境下建议使用pip安装
python版本2.7.6
下载pip并安装
wget
https://pypi.python.org/packages/source/p/pip/pip-1.5.6.tar.gz
tar zxvf pip-1.5.6.tar.gz
cd pip-1.5.6
sudo python setup.py install
#sudo 看情况使用
pip安装bs4
sudo pip install beautifulsoup4
bs4使用简介,代码举例
#!/usr/bin/python
# -*- coding: utf-8 -*-
import sys
import urllib2
from bs4 import BeautifulSoup as bs
import urllib
url = "http://www.xxx.com"
# bs解析html table
soup = bs(urllib.urlopen(url))
#print soup
f = open("soup.txt", "w")
#保存一下看看解析后的格式
f.write(str(soup))
f.close()
# bs解析html table
for link in soup.findAll('a'):
print link.string
print soup.findAll('td')
还可以参考下面这2篇文章:
python 中BeautifulSoup入门
http://www.cnblogs.com/yupeng/p/3362031.html
BeautifulSoup获取指定的td的问题
http://bbs.chinaunix.net/thread-3907332-1-1.html