自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(7)
  • 资源 (18)
  • 收藏
  • 关注

原创 Ant基础教程

一、Ant简介Ant是一个将软件编译、测试、部署等步骤联系在一起加以自动化的一个工具建,类似于Linux上构建C/C++的makefile,Ant通常用来构建Java程序。Ant官网:http://ant.apache.org/二、Ant安装和配置下载地址:http://ant.apache.org/bindownload.cgi前提:JDK已经安装(参考htt

2015-03-18 21:36:32 382

转载 JPA project Change Event Handler问题解决

这是Eclipse中的一个GUG:Bug 386171 - JPA Java Change Event Handler (Waiting)解决方法:1.) 退出Myeclipse(或eclipse);2.) 进入Myeclipse(或eclipse)的安装目录;linux中:mkdir disabledmkdir disabled/featur

2015-01-26 12:43:59 1734

转载 Perforce Can't clobber writable file ************** 解决方法

Perforce 在执行get latest (unshelve)的时候,出现以下错误:can't clobber writable file ........

2014-11-10 11:17:48 4899

原创 JDK安装及环境变量配置

Windows1.      从http://www.oracle.com/technetwork/java/javase/downloads/index.html找到最新的JDK8, 或者从http://www.oracle.com/technetwork/java/javase/archive-139210.html找早期的版本(目前JDK6还是很流行的,某些情况下,需要安装早期的版本),

2014-05-24 23:43:10 1003

原创 Linux write系统调用问题(对齐问题)

最近在学习Linux C 编程,碰到一个疑问程序1: #include #include int main() { if ((write(1, "Here is some data\n", 18)) != 18) write(2, "A error has occured on file descriptior 1\n", 42); exit(

2012-08-07 23:27:18 646 1

转载 Android ADT17及以上版本开发添加第三方jar包编译通过,运行时出现 “NoClassDefFoundError

下载了Android 4的SDK后,需要ADT17才能开发,于是将ADT升级到版本17,发现添加第三方jar包编译通过,运行时出现 “NoClassDefFoundError” .    网上找到了一个解决方案,参考此博客http://blog.csdn.net/huzgd/article/details/7604069    导致此问题的原因,是新版的ADT管理JAR包的方式发生成变化,

2012-08-07 22:17:54 427

原创 Android ADT17及以上版本开发添加第三方jar包编译通过,运行时出现 “NoClassDefFoundError” ....

下载了Android 4的SDK后,需要ADT17才能开发,于是将ADT升级到版本17,发现添加第三方jar包编译通过,运行时出现 “NoClassDefFoundError” . 网上找到了一个解决方案,参考此博客[url]http://blog.csdn.net/huzgd/article/details/7604069[/url] 导致此问题的原因,是新版的ADT管理...

2012-07-26 10:50:14 106

网络爬虫在 Web 信息搜索与数据挖掘中应用

分析了万维网不良网络信息对网络文化安全带来的挑战, 提出了Web信息搜索与数据挖掘体系结构, 并介绍了该体系结构中的关键技术和运行原理。分析了普通爬虫所实现的功能和不足之后,重点论述了该爬虫的工作原理、实现方式和性能分析以及该爬虫不同于其它爬虫的功能和在 Web 信息搜索与数据挖掘体系中应用。通过试验测试表明, 该爬虫能够很好地获取万维网上的各种信息资源, 有助于网络文化内容监测与管理。

2010-09-16

网络爬虫对网络安全的影响及其对策分析

  网络爬虫已经广泛应用于互联网 ,能完成许多有用的工作 ,同时也会对网络安全产生一定的负面影响。文章论述了网络爬虫对网络安全构成的威胁 ,并重点提出对其不利影响的应对策略。

2010-09-16

网络爬虫的设计与实现

Web爬虫有两种爬取策略。基于Webcrawler(web爬虫)设计的BFS(广度优先)策略,文章使用MD5算法,来进行0(1)时间复杂度的链接判重。为了避免频繁的查询DNS服务器,建立DNS缓存。另外,也因一般行为模式的考量,在中加入了IP范围控制技术,网页过滤方法,和多线程并发技术。最后。给出了此爬虫所需的时间分析,以供评估并后续发展。

2010-09-16

启发式搜索在网络爬虫中应用的分析

介绍了网络爬虫的工作原理, 分析了传统的两种启发式算法—— —基于有限空间的A*搜索算法和局部搜索的爬山算法在网络爬虫中应用的可行性及局限性。并详细阐述了应用了模拟退火算法的网络爬虫网页搜索的过程, 并结合一个搜索实验说明了基于模拟退火算法的网络爬虫搜索性能的优越性。

2010-09-16

面向主题的网页采集系统的设计与研究

对面向主题的信息采集技术进行了探索性研究。采用基于DOM的信息抽取技术, 建立混合空问模型表示内容和结构特征信息,并通过定义网贞间相似性来识别主题页面。较好的处理了Web信息抽取中主题页面识别的问题,实验结果证明了系统的可行性。

2010-09-16

领域相关的 Web网站抓取方法

  本文提出了一种抓取领域相关的 Web站点的方法 ,可以在较小的代价下准确地收集用户所关心领域内的网站。这种方法主要改进了传统的聚焦爬虫( Focused Crawler)技术 ,首先利用 Meta2Search技术来改进传统 Crawler 的通过链接分析来抓取网页的方法 ,而后利用启发式搜索大大降低了搜索代价 ,通过引入一种评价领域相关性的打分方法 ,达到了较好的准确率。本文详细地描述了上述算法并通过详细的实验验证了算法的效率和效果。

2010-09-16

搜索引擎原理之网络爬虫

随着互联网和宽带上网的普及,搜索引擎在中国异军突起,网络爬虫了,可以从互联网上搜取各式各样的信息,组成搜索引擎的资料库,以便用户查询。

2010-09-16

Bloom filter 的研究和应用

Bloom filter是一个简明的空间效率极高的随机的数据结构。用Bloom filter 表示 cache 内容 ,可以高效地实现cache 协作。Bloom filter 易于实现并有较低的错误预测。本文最后指出进一步研究的方向。

2010-09-16

BloomFilter及其应用综述

Bloom filter是一个简明的空间效率极高的随机的数据结构。用Bloom filter 表示 cache 内容 ,可以高效地实现cache 协作。本文对BloomFilter及其改进型进行了综述性分析,探讨了它的实用性。

2010-09-16

Packet Tracer 5.0软件使用教程深入详解

可以这么说,我用过有许多好的网络模拟软件,其中不乏有特别优秀的!比如Boson的Boson NetSim for CCNA 6.0就很优秀。但是自从我用了Packet Tracer这个思科官方模拟软件后,我发现竟有更优秀的。他的最新版本是Packet Tracer 5.0,直到现在我使用这个工具仍然是爱不释手,好了闲话不多说,工作!网络上有相关Packet Tracer的所谓“教程”,但是都只是皮毛,今天我从以下三个方面入手介绍Packet Tracer 5.0这个软件。

2010-09-15

一种新型网络爬虫的设计与实现

网络爬虫是当今网络实时更新和搜索引擎技术的共同产物 文中深入探讨了如何应用网络爬虫技术实现实时更新数据和搜索引擎技术 在对网络爬虫技术进行深入分析的基础上,给出了一种用网络爬虫技术实现局域网内服务器和客户端之间网络通信的解决方案

2010-09-15

DOS命令之——net命令详解

许多 Windows NT 网络命令以 net 开始。这些 net 命令有一些公共属性: 通过键入 net /? 可查阅所有可用的 net 命令。 通过键入 net help 命令可在命令行中获得 net 命令的语法帮助。例如,要得到 net acco unts 命令的帮助,请键入 net help accounts。 所有 net 命令接受选项 / yes 和 /no(可缩写为 / y 和 /n )。/ y 对命令产生的任何交 互提示自动回答“是”,/n 回答“否”。例如,net stop server 通常提示确认是否根据服 务器服务结束所有服务,net stop server /y 自动回答“是”并关闭服务器服务。

2010-09-15

更高水平的云计算----云计算入门指南

云计算在许多方面只是互联网的一个比喻词,亦即计算和数据资源日益迁移到 Web 上的比喻词。不过,区别也是存在的:云计算代表网络计算价值的一个新的临界点。它提供更高的效率、巨大的可扩展性和更快、更容易的软件开发。其中心内容为新的编程模型、新的 IT 基础设施以及实现新的商业模式。

2010-09-15

基于 WEB 的智能信息采集及处理

本文研究的基于 Web 的智能信息采集及处理系统,一方面采用高效的 URL 去重和基于模版的下载机制,极大提高了采集Web资源的性能;另一方面应用成熟 先进的自然语言处理技术,对采集信息做智能分类和摘要

2010-09-15

一种新的网络爬虫带宽控制策略

网络爬虫如何在限定带宽的条件下进行爬行是一个有巨大应用价值的问题,但是目前对这个方面的研究较少,本文提出了一种基于对站点礼貌爬行的爬虫带宽控制策略,通过对不同站点下载速度的建模分析和基于礼貌爬行的访问频率控制,得到了面向站点的爬行控制算法,最后实验证明这种方法能够充分利用所限定的带宽。

2010-09-15

基于本体的主题网络爬虫设计

  网络爬虫是搜索引擎的重要组成部分。分析了主题网络爬虫的工作原理 ,研究了主题相关度的计算方法 ,提出了基于本体的主题网络爬虫解决方案 ,设计实现了评估实验系统。最后对实验的结果进行了比较 ,论证了其可行性。

2010-09-15

基于本体的网络爬虫技术研究

互联网已经成为最大的非结构化数据库, 极大方便了信息访问。然而, 网络上的信息大多都是无组织的, 由于网络的分布式特性, 很难对它进行信息和知识管理。因此, 如何建立一个智能的信息发现机制很有必要。本文在分析了爬虫工作原理和传统算法后, 提出了一种基于本体的网络爬虫的信息发现框架。该框架包含了预处理模块和本体管理模块, 定义了网页相关度计算策略, 最后通过实验对该框架进行了评估。

2010-09-15

基于Web元数据的定题信息采集.pdf

针对定题We b 检索技术,研究了元数据在定题Web信息采集中的重要作用。设计了基于Web元数据的主题扩展系统及定题信息采集系统, 并给出了系统实现的具体步骤。同时提出了基于Web元数据的多种定题信息采集策略。实验证明经主题扩展的Web元数据可作为网页主题相关性的重要判别依据, 带增益的元数据平均权值启发式采集策略算法具有较好的性能。

2010-09-15

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除