由于项目的需要,要对一些网页的数据,进行抓取
我的操作步骤是:先对 数据页面进行再控制台输出(我用java语言)然后用htmlparser工具包,对页面进行控制,得到我想要的数据;这个好实现.
因为今天要抓取的一个页面经过了session做用户登录判断处理,所以我不可以直接去访问(并且输出该页面的html代码),如果我这么操作,页面控制台会输出:提示我登陆,()
我想把这个登陆的验证,给过滤掉,请问各位同仁,有没有这个可能呢?就是想过滤session验证的这个步骤.
由于项目的需要,要对一些网页的数据,进行抓取
我的操作步骤是:先对 数据页面进行再控制台输出(我用java语言)然后用htmlparser工具包,对页面进行控制,得到我想要的数据;这个好实现.
因为今天要抓取的一个页面经过了session做用户登录判断处理,所以我不可以直接去访问(并且输出该页面的html代码),如果我这么操作,页面控制台会输出:提示我登陆,()
我想把这个登陆的验证,给过滤掉,请问各位同仁,有没有这个可能呢?就是想过滤session验证的这个步骤.