- 博客(2)
- 收藏
- 关注
原创 session 与cookie
<br />最近开发微博应用,需要写两个jsp页面。<br />本来想直接使用sdk里自带的两个jsp页面。<br />但是没想到,在我的机器上运行两个jsp页面的时候,页面B死活取不到页面A的数据。<br /> <br /> <br />分析其原因,在于两个页面之间是使用session来传递数据。<br />而我的整个工程是运行在我的本地机器上,而访问地址确实映射到外网服务器上。所以session都存在了外网服务器。而本地的jsp页面取不到外网服务器上的session。导致页面之间传值失败。<br />
2011-04-26 19:17:00 897
原创 cx-extractor:基于行块分布函数的通用网页正文抽取:线性时间、不建DOM树、与HTML标签无关
<br />今天看了cx师兄写过的一个网页正文抽取算法。线性时间、不建DOM树、与HTML标签无关,十分佩服。<br /> <br />简述其主要思想如下:<br />1.将网页HTML文本去除其所有标签及脚本,得到粗糙正文块<br />2. 求行块字数的分布函数。<br />3.求该函数的骤升和骤降点,中间即为正文。<br /> <br />其中,行块是指,以第i行为轴,取其周围k行,为第i个行块。很简单是不是。<br />行块字数,是说第i个行块内的文本总字数。也很简单对不对。<br /> <br />
2011-04-26 19:04:00 4952
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人