![](https://img-blog.csdnimg.cn/20201014180756918.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
算法类
yuan_xulong
这个作者很懒,什么都没留下…
展开
-
基于逻辑行和最大接纳距离的网页正文抽取
最近由于工作的需要,在网上查找了一些关于网页内容抽取的资料,其中“基于逻辑行和最大接纳距离的网页正文抽取”的算法易于实现且抽取效果较好,故编写代码实现,以下描述该算法。 算法的基本思路: 人们在编写HTML网页时,几乎都会遵循这样的规则: 1.以行为单位编写HTML代码,也就是说HTML中的每一行大都表示一个相对完整的语义。 2.正文代码通常在物理位置上都会靠得很近,也就是...2010-04-28 13:09:15 · 82 阅读 · 0 评论 -
用位图实现整数排序
命题:一个顺序输入文件(比如磁带机),无序保存了一些整型值,这些值最小从1开始,最大不超过10000000,且没有重复,要求对文件中的数值进行排序,并按升序输出. 约束:可以使用的内存很小,最大不超过2M内存. 算法实现:可以使用位图来实现该排序,具体描述,假设有5个数字集合{1,2,3,5,8},可以用10位位图表示为{1,1,1,0,1,0,0,1,0,0},位图...2013-04-18 10:20:37 · 136 阅读 · 0 评论