用java获取网页所需信息

最新推荐文章于 2023-12-13 15:45:08 发布

Seven_cm

最新推荐文章于 2023-12-13 15:45:08 发布

阅读量986

点赞数

分类专栏： Java

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Seven_cm/article/details/8826540

版权

Java 专栏收录该内容

22 篇文章 0 订阅

订阅专栏

通过goole得知，要获取网页内容，可使用HttpURLConnection类来获取网页代码，进而使用String的字符串过滤即可获得所需的网页信息。

然而在整个小java程序都写得差不多时，在测试的时候，发现获取到的网页代码是乱码：

google之，才了解到，原来网页是经过了gzip的压缩，这样直接通过

InputStream is = con.getInputStream();
				StringBuffer stringBuffer = new StringBuffer();
				Reader reader = new InputStreamReader(is,st);

来读，肯定是乱码，因为没用gzip来读取数据。这样，只需使用：

GZIPInputStream gzin = new GZIPInputStream(is);

来读取数据流即可。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
用java获取网页所需信息

通过goole得知，要获取网页内容，可使用HttpURLConnection类来获取网页代码，进而使用String的字符串过滤即可获得所需的网页信息。然而在整个小java程序都写得差不多时，在测试的时候，发现获取到的网页代码是乱码：google之，才了解到，原来网页是经过了gzip的压缩，这样直接通过InputStream is = con.getInputStream()
复制链接

扫一扫

专栏目录

博客等级

码龄13年

66
原创

50
点赞

14
收藏

74
粉丝

关注

私信

热门文章

分类专栏

Java 22篇
其他 9篇
java web 18篇
weblogic
Oracle 2篇
mysql 6篇
ubuntu 14.04 3篇
eclipse插件 4篇
前端 4篇
net 2篇
微信支付 2篇

最新评论

博客后续会转移到chinaos
CSDN-Ada助手: 非常感谢CSDN博主的分享，非常期待他的博客后续会转移到chinaos。我觉得可以写一篇关于Linux操作系统中的文件系统的博文，介绍不同的文件系统类型和它们的特点，帮助其他用户更好地理解和使用Linux操作系统。这样的技术文章对其他用户来说一定非常有用。下一篇博客可以继续就Linux操作系统的网络配置和优化继续写，相信会有更多读者受益。加油！为了方便博主创作，提高生产力，CSDN上线了AI写作助手功能，就在创作编辑器右侧哦～（https://mp.csdn.net/edit?utm_source=blog_comment_recall ）诚邀您来加入测评，到此（https://activity.csdn.net/creatActivity?id=10450&utm_source=blog_comment_recall）发布测评文章即可获得「话题勋章」，同时还有机会拿定制奖牌。
CCProxy的使用
be_chill: 请问去哪里下载ccProxy
在使用jquery.twbsPagination分页时遇到的问题
您的用户昵称不存在: 完整示例 [code=javascript] $(document).ready(function () { loadData(1); }); function loadData(page) { $.post("/loadPageData", { page: page }, function (data) { // your code... pagination(data.totalPages); }); } function pagination(totalPages) { let currentPage = Math.min($('#pagination').twbsPagination('getCurrentPage'), totalPages); $('#pagination').twbsPagination('destroy'); $('#pagination').twbsPagination({ startPage: currentPage, totalPages: totalPages, visiblePages: 5, initiateStartPageClick: false, onPageClick: function (event, page) { loadData(page); } }); } [/code]
Eclipse启动报错java.lang.NoClassDefFoundError
qq_41550649 回复平凡之路_qi: 没有用
Eclipse启动报错java.lang.NoClassDefFoundError
qq_41550649: 我也没有这个文件。我的报错如下!SESSION 2019-03-03 14:54:11.834 ----------------------------------------------- eclipse.buildId=4.6.3.M20170301-0400 java.version=11.0.2 java.vendor=Oracle Corporation BootLoader constants: OS=win32, ARCH=x86_64, WS=win32, NL=zh_CN Framework arguments: -product org.eclipse.epp.package.jee.product Command-line arguments: -os win32 -ws win32 -arch x86_64 -product org.eclipse.epp.package.jee.product !ENTRY org.eclipse.osgi 4 0 2019-03-03 14:56:35.601 !MESSAGE Application error !STACK 1 org.eclipse.e4.core.di.InjectionException: java.lang.NoClassDefFoundError: javax/annotation/PostConstruct at org.eclipse.e4.core.internal.di.InjectorImpl.internalMake(InjectorImpl.java:386) at org.eclipse.e4.core.internal.di.InjectorImpl.make(InjectorImpl.java:294) at org.eclipse.e4.core.contexts.ContextInjectionFactory.make(ContextInjectionFactory.java:162) at org.eclipse.e4.ui.internal.workbench.swt.E4Application.createDefaultHeadlessContext(E4Application.java:490) at org.eclipse.e

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。