自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(2)
  • 收藏
  • 关注

原创 session 与cookie

<br />最近开发微博应用,需要写两个jsp页面。<br />本来想直接使用sdk里自带的两个jsp页面。<br />但是没想到,在我的机器上运行两个jsp页面的时候,页面B死活取不到页面A的数据。<br /> <br /> <br />分析其原因,在于两个页面之间是使用session来传递数据。<br />而我的整个工程是运行在我的本地机器上,而访问地址确实映射到外网服务器上。所以session都存在了外网服务器。而本地的jsp页面取不到外网服务器上的session。导致页面之间传值失败。<br /> 

2011-04-26 19:17:00 897

原创 cx-extractor:基于行块分布函数的通用网页正文抽取:线性时间、不建DOM树、与HTML标签无关

<br />今天看了cx师兄写过的一个网页正文抽取算法。线性时间、不建DOM树、与HTML标签无关,十分佩服。<br /> <br />简述其主要思想如下:<br />1.将网页HTML文本去除其所有标签及脚本,得到粗糙正文块<br />2. 求行块字数的分布函数。<br />3.求该函数的骤升和骤降点,中间即为正文。<br /> <br />其中,行块是指,以第i行为轴,取其周围k行,为第i个行块。很简单是不是。<br />行块字数,是说第i个行块内的文本总字数。也很简单对不对。<br /> <br />

2011-04-26 19:04:00 4952

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除