HttpClient
xinyu1234567
坚持原创,坚持写自己的东西
展开
-
HttpClient的相关知识
前言 超文本传输协议(HTTP)也许是当今互联网上使用的最重要的协议了。Web服务,有网络功能的设备和网络计算的发展,都持续扩展了HTTP协议的角色,超越了用户使用的Web浏览器范畴,同时,也增加了需要HTTP协议支持的应用程序的数量。 尽管java.net包提供了基本通过HTTP访问资源的功能,但它没有提供全面的灵活性和其它很多应用程序需要的功能。HttpClient就是寻求弥补这项转载 2014-09-16 09:55:38 · 398 阅读 · 0 评论 -
基于行块分布函数的通用网页正文抽取算法初步认识
方法核心依据有两点:正文区的密度、行块的长度 将HTML去标签,留下正文 同时留下标签去除后的所有空白 位置信息。留下的正文称为Ctext 行块:以Ctext中的行号为轴取其周围k行,合起来称为一个 行块Cblock。 行块长度:一个Cblock去掉其中所有空白符后的字符总数 称为该行块的长度。 行块分布函数: 以Ctext每行为轴,共有LinesNum(Ctext原创 2014-09-16 17:58:55 · 2423 阅读 · 0 评论