2015年08月_hayleyxia

08月 07月 06月 05月 04月

原创富文本编辑器UMeditor在backbone中的使用

UMeditor,简称UM,是为满足广大门户网站对于简单发帖框，或者回复框需求所定制的在线富文本编辑器。 UM的主要特点就是容量和加载速度上的改变，主文件的代码量为139k，而且放弃了使用传统的iframe模式，采用了div的加载方式，以达到更快的加载速度和零加载失败率。现在UM的第一个使用者是百度贴吧，贴吧每天几亿的pv是对UM各种指标的最好测试平台。当然随着代码的减少，UM的功能对于UE来说

2015-08-27 19:45:33 1334

当前,W eb 已经成为人们获取信息的主要渠道之一. 然而, 用于表达W eb 页面信息的HTML 语言存在着与生俱来的缺点. HTML 的“标记”只是告诉浏览器软件如何显示所定义的信息, 却不包含任何语义. 因此由HTML 语言所表述的W eb 页面经过浏览器分析后只适合人们浏览, 不适合作为一种数据交换的方式由机器处理. 该文以文档对象模型DOM 为基础, 把所要提取的信息在DOM 层次结构中的路径作为信息抽取的“坐标”, 并以这个基本原理为基础设计了一种归纳学习算法来半自动地生成提取规则, 然后根据提取规则生成Java 类. 生成的Ja2va 类可以作为W eb 数据源包装器组成的重要构件.

2010-03-01

模板化网页主题信息的提取方法

为了消除网页噪音, 有效地提取基于模板的网页主题信息, 提出了一种新的信息提取方法。该方法采用机器自动学习方式生成网页集的模板; 以网页链接关系中的锚点文本作为提取目标对模板进行标记, 生成对应模板的提取规则; 依据模板的提取规则对网页主题信息进行提取。对国内2 588 个新闻网页进行了检测。实验结果表明, 该方法可以快速、有效地提取模板生成的网页集主题信息, 准确率达99. 5%。将该方法应用于搜索引擎系统(木棉检索) 中, 与原来的检索系统相比较, 索引文件的大小减少约50% , 检索的速度和精确度也得到提高。

2010-03-01

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

hayleyxia的专栏

原创富文本编辑器UMeditor在backbone中的使用

基于DOM 的Web 信息提取

模板化网页主题信息的提取方法

基于web资源的信息抽取技术

Pro Drupal Development 2ndEdition.pdf

ppk on JavaScript.pdf

SQL Cookbook

空空如也

原创 富文本编辑器UMeditor在backbone中的使用

基于DOM 的Web 信息提取

模板化网页主题信息的提取方法

基于web资源的信息抽取技术

Pro Drupal Development 2ndEdition.pdf

ppk on JavaScript.pdf

SQL Cookbook

空空如也

原创富文本编辑器UMeditor在backbone中的使用