1,用户httpclient获取远端html页面 2,用jsoup解析html的内容 http://www.open-open.com/jsoup/parse-document-from-string.htm