java
四宝汤
这个作者很懒,什么都没留下…
展开
-
网页正文提取方案
网页正文提取方案闲暇时间无聊,研究了下如何获取网页正文的方案。这里说的网页正文主要是针对博客、新闻等文章类的网页进行获取,筛选出正文主题的内容。关于方案网上常用的方案有如下几种: 1. 根据解析dom结构,利用标签的特性来获取。比如titile,h1一般表示标题,p一般大多数在正文。去计算的时候可以去设置一些权重的方案,比方说div下包含p +1分,包含li减分等等。 2. 根据文字密度的来原创 2017-02-28 14:01:19 · 948 阅读 · 0 评论 -
线程通信——CountDownLatch和CyclicBarrier
CountDownLatch和CyclicBarrierCyclicBarrier和CountDownLatch都是java的线程通信工具类,他们的都是对常用的线程通信模型进行了封装,为了更方便让我们完成线程交互通信。那么这两个通信模型的如何工作,他们俩有什么区别呢。原创 2017-03-01 11:48:30 · 270 阅读 · 0 评论 -
spring springmvc hibernate4 整合
今天初次尝试spring与hibernate,差不多花了整整大半天时间,想想怕日后把文件丢了啥的,还是写份资料的好 web.xml 代码<?xml version="1.0" encoding="UTF-8"?><web-app version="3.0" xmlns="http://java.sun.com/xml/ns/javaee"...2014-04-01 23:18:19 · 76 阅读 · 0 评论