自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(1)
  • 资源 (6)
  • 收藏
  • 关注

原创 富文本编辑器UMeditor在backbone中的使用

UMeditor,简称UM,是为满足广大门户网站对于简单发帖框,或者回复框需求所定制的在线富文本编辑器。 UM的主要特点就是容量和加载速度上的改变,主文件的代码量为139k,而且放弃了使用传统的iframe模式,采用了div的加载方式, 以达到更快的加载速度和零加载失败率。现在UM的第一个使用者是百度贴吧,贴吧每天几亿的pv是对UM各种指标的最好测试平台。 当然随着代码的减少,UM的功能对于UE来说

2015-08-27 19:45:33 1334

基于DOM 的Web 信息提取

当前,W eb 已经成为人们获取信息的主要渠道之一. 然而, 用于表达W eb 页面信息的HTML 语言存在着与生俱来的缺点. HTML 的“标记”只是告诉浏览器软件如何显示所定义的信息, 却不包含任何语义. 因此由HTML 语言所表述的W eb 页面经过浏览器分析后只适合人们浏览, 不适合作为一种数据交换的方式由机器处理. 该文以文档对象模型DOM 为基础, 把所要提取的信息在DOM 层次结构中的路径作为信息抽取的“坐标”, 并以这个基本原理为基础设计了一种归纳学习算法来半自动地生成提取规则, 然后根据提取规则生成Java 类. 生成的Ja2va 类可以作为W eb 数据源包装器组成的重要构件.

2010-03-01

模板化网页主题信息的提取方法

为了消除网页噪音, 有效地提取基于模板的网页主 题信息, 提出了一种新的信息提取方法。该方法采用机器自动学习方式生成网页集的模板; 以网页链接关系中的锚点文本作为提取目标对模板进行标记, 生成对应模板的提取规则; 依据模板的提取规则对网页主题信息进行提取。对国内2 588 个新闻网页进行了检测。实验结果表明, 该方法可以快速、有效地提取模板生成的网页集主题信息, 准确率达99. 5%。将该方法应用于搜索引擎系统(木棉检索) 中, 与原来的检索系统相比较, 索引文件的大小减少约50% , 检索的速度和精确度也得到提高。

2010-03-01

基于web资源的信息抽取技术

 W eb 资源含有大量的有用信息, 但由于它们欠结构化, 不能为传统的数据库型查询系统所利用。如 何将这些信息抽取出来, 转化成结构化信息, 供其它信息集成系统所利用, 成为该领域的研究热点。本文介 绍了一个简单的W eb 信息抽取模型, 对于基于该模型的w rapper 归纳技术进行了探讨, 并描述了一个w rap2 per 自动生成系统的原型。

2010-03-01

Pro Drupal Development 2ndEdition.pdf

drupal专业开发英文版, drupal的初学者可以按照文档练习

2009-08-20

ppk on JavaScript.pdf

世界级大师著作,本书全方位介绍了JavaScript,主要讨论了浏览器兼容性、可访问性、底层语法以及与HTML结构层的协同等问题。书中既包括理论性的讲解,又给出了相关的示例脚本以进行进一步阐述。通过8个真实项目示例,介绍了JavaScript核心语言、BOM、事件处理、DOM、修改CSS样式表以及数据检索等内容。 本书适合具有一定网页开发经验的Web开发人员阅读。

2009-08-03

SQL Cookbook

SQL Cookbook By Anthony Molinaro ............................................... Publisher: O'Reilly Pub Date: December 2005 Print ISBN-10: 0-596-00976-3 Print ISBN-13: 978-0-59-600976-2 Pages: 628

2009-01-04

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除