最近工作需要获取网页里的信息,本来我是用c#实现的,结果老板临时改主意必须用java(鄙视BOSS)。
用java实现网页的获取方法很多,我只介绍apache的httpclient。
1.从简单入手,获取不需要登录网站的网页
获取无需登录的网页非常简单。代码如下:
baiduInfo就是你获得的html源文件。
此时,你可能会发现获得的源文件有的是乱码,还有需要输入用户名和密码的网站信息怎么获取呢?请听下回分解!
最近工作需要获取网页里的信息,本来我是用c#实现的,结果老板临时改主意必须用java(鄙视BOSS)。
用java实现网页的获取方法很多,我只介绍apache的httpclient。
1.从简单入手,获取不需要登录网站的网页
获取无需登录的网页非常简单。代码如下:
baiduInfo就是你获得的html源文件。
此时,你可能会发现获得的源文件有的是乱码,还有需要输入用户名和密码的网站信息怎么获取呢?请听下回分解!