自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

Alan Zhuang的博客

本人在工作中将每天学习到的知识进行编辑整理,与人分享。

  • 博客(25)
  • 资源 (27)
  • 收藏
  • 关注

原创 linux系统中tomcat8下安装solr 6.6 并与nutch2.2.1整合

今天小编将要把solr放到tomcat。小编已经在自己的服务器上安装好了solr以及tomcat,安装过程可以参考小编的下面的 文章。 hadoop搭建:http://blog.csdn.net/shuaigexiaobo/article/details/77481391 hbase搭建:http://blog.csdn.net/shuaigexiaobo/articl

2017-08-28 17:29:44 825

原创 使用 Hadoop,Nutch ,Hbase,Solr 搭建搜索引擎抓取并测试搜索结果

这篇文章小编将给大家继续讲解在已经搭建好了 Hadoop,Nutch ,Hbase,Solr 之后进行数据的抓取以及测试搜索效果hadoop搭建:http://blog.csdn.net/shuaigexiaobo/article/details/77481391hbase搭建:http://blog.csdn.net/shuaigexiaobo/article/details/77503

2017-08-28 15:17:12 1939 2

原创 Tomcat 7.0 在centOS 6.9的安装

今天小编要安装Tomcat 7.0,为了以后能够和Solr更好的交互。小编的电脑上已经安装了java version "1.8.0_60"。    安装说明:    系统:Cent OS 6.9     软件:apache-tomcat-7.0.81.tar.gz     下载地址:http://tomcat.apache.org/download-70.cgi    安装前提

2017-08-28 14:15:52 3185

原创 使用 Hadoop,Nutch ,Hbase,Solr 搭建搜索引擎之搭建solr4.9.1

这篇文章小编讲解Nutch2.3的搭建,前提是已经搭建好了hadoop,以及Hbase,还没有搭建好的可以参考小编的这两篇文章。    Hadoop搭建:http://blog.csdn.net/shuaigexiaobo/article/details/77481391    Hbase搭建:http://blog.csdn.net/shuaigexiaobo/article/detai

2017-08-23 18:09:37 718 3

原创 使用 Hadoop,Nutch ,Hbase,Solr 搭建搜索引擎之Nutch2.2.1

这篇文章小编讲解Nutch2.3的搭建,前提是已经搭建好了hadoop,以及Hbase,还没有搭建好的可以参考小编的这两篇文章。    Hadoop搭建:http://blog.csdn.net/shuaigexiaobo/article/details/77481391    Hbase搭建:http://blog.csdn.net/shuaigexiaobo/article/detai

2017-08-23 15:07:38 1233 3

原创 使用 Hadoop,Nutch ,Hbase,Solr 搭建搜索引擎之Hbase-0.94.27.搭建

Hbase的环境搭建     Hbase是一个分布式的、面向列的开源数据库,该技术来源于Chang et al所撰写的Google论文“Bigtable:一个结构化数据的分布式存储系统”。就像Bigtable利用了Google文件系统(File System)所提供的分布式数据存储一样,hbase在Hadoop之上提供了类似于Bigtable的能力。HBase是Apache的hadoop项目的

2017-08-23 11:28:15 789 3

原创 使用 Hadoop,Nutch ,Hbase,Solr 搭建搜索引擎之Hadoop1.2.1搭建

1.Hadoop环境搭建,安装Hadoop1.2.1    (一)进入或者创建usr/local/hadoop文件夹中    (二)使用如下命令 ,获取hadoop-1.2.1.tar.gz       wget https://archive.apache.org/dist/hadoop/core/hadoop-1.2.1/hadoop-1.2.1.tar.gz    (三)在

2017-08-23 10:56:53 1375

原创 nutch 执行流程以及简介

Nutch体系流程图:        第一步:generator差生抓取列表,在generator产生抓取列表的过程中,会生成crawl_generator文件夹。    第二步:fetcher 从网上抓取网页,生成crawl_fetch以及content,content抓取下来的网页的源代码二进制的内容,crawl_fetch,每一个抓取URL的状态。    第三步:对抓取得网页

2017-08-22 15:57:54 611 3

转载 nutch1.6安装使用中错误解决方法

本文为小编在使用nutch 1.6中遇到的问题,这篇文章刚好解决了小编的问题。原文网址:http://blog.csdn.net/chaishen10000/article/details/7183382网络上大多解释是:在{nutch}/conf下找到nutch-default.xml如果一开始的属性设置为: http.agent.name 则可能会抛出Fe

2017-08-22 09:36:27 491

原创 Nutch 1.6 安装过程

本篇小编主要说的是nutch1.6版本的.在liunx系统上运行,先从svn中下载下来。如果没有安装svn 可以使用 yum安装 命令如下:    输入:java -version java version "1.6.0_45"Java(TM) SE Runtime Environment (build 1.6.0_45-b06)Java HotSpot(TM) 64-Bi

2017-08-21 19:53:38 721 3

原创 Lucene 搜索 一个测试程序

今天小编接到一个任务,做网站搜索以及其内容显示,小编接到这个任务后就开始了解了Lucene,基于Java的全文索引/检索引擎——Lucene    Lucene不是一个完整的全文索引应用,而是是一个用Java写的全文索引引擎工具包,它可以方便的嵌入到各种应用中实现针对应用的全文索引/检索功能。    Lucene的作者:Lucene的贡献者Doug Cutting是一位资深全文索引

2017-08-18 16:07:56 477 3

原创 全文检索概念介绍

1.全文检索概念介绍    今天小编给大家讲解全文搜索的概念,希望大家对全文搜索能够有一个整体的了解。1.1我们身边的搜索l        在BBS、BLOG、新闻等系统中提供的搜索文章的功能,如这里的贴吧的例子。搜索的范围是系统内的文章数据,搜索出来之后符合条件的记录高亮、并且按点击率排序l        Eclipse中的帮助子系统:点击HelpàHelpContents,可以

2017-08-18 15:15:48 8284 4

原创 Linux vi简介以及命令

今天小编给大家介绍一款非常实用的软件命令:vi 。    vi命令    vi 是 "visual interface" 命令的的简称,它在Linux上的地位就像Edit在DOS上的地位一样。它可以执行输出,查找,删除,块操作等众多文本操作,而且用户可以根据自己的需要对其进行定制。vi不是一个排版程序,它不像word或者WPS那样可以对字体,格式,段落等其它属性进行编排。它只是一个文本编辑

2017-08-16 15:34:57 992 1

原创 Linux 常用基本命令 权限

小编今天给大家讲解一些关于文件的权限的问题,在下图中,可以看到文件或者目录的最前面有10个位置,第一个位置代表文件类型,前面是-的为普通文件。第二到第四个是文件拥有者所具有的权限,第五到第七位置是文件所在的组具有的权限,第八到第十个是其它人所有的权限。           其中 r 表示英语里面的read,可读。    其中 w 表示英语里面的write,可写。    其中 x 表

2017-08-15 10:27:12 1624 1

原创 Linux 常用基本命令 用户组

今天小编给大家讲解Linux里面的用户组。(一)

2017-08-14 15:27:47 1904 1

原创 Linux 基本常用命令 用户 useradd,userdel,su,passwd

今天小编给大家讲解Linux/Unix系统上如何创建用户,如何创建组。    (三)增加用户:useradd    useradd命令用于Linux中创建的新的系统用户。useradd可用来建立用户帐号。也可以使用adduser,因为adduser命令是指向useradd命令的一个链接,因此这两个命令的使用方式完全一样。帐号建好之后,再用passwd设定帐号的密码.而可用userdel删除

2017-08-11 18:07:12 3074 1

原创 Linux常用基本命令 -用户、权限管理who,whoami,exit

用户是Unix/Linux系统工作中重要的一环,用户管理包括用户与组账号的管理。    在Unix/Linux系统中,不论是本机或者是远程登录系统,每个系统都必须拥有一个账号,并且对于不同的系统资源拥有不同的使用权限。    Unix/Linux系统中的root账号通常用于系统的维护和管理,他对Unix/Linux操作系统的所有部分具有不受限制的访问权限。    在Unix/Linux

2017-08-11 11:07:26 4882 1

原创 EMAIL的客户端程序

今天小编给大家讲解EMAIL的客户端程序  ,这个程序也是小编我在东北大学读研究生期间学习的,今天分享给大家。    1. 实验目的    随着互联网的发展,越来越多的人使用电子邮件交流工作,电子邮件已经成为生活中必不可少的一部分。本系统目的通过客户端软件实现电子邮件的发送和接收。通过SMTP协议来发送邮件到邮件服务器,通过POP3协议从邮件服务器中读取邮件。    2. 实验环境

2017-08-10 20:36:03 4791 10

原创 路由追踪的实现

今天小编将给大家分享我在东北大学上研究生的时候学到的关于路由追踪的实现,希望大家看完小编的这篇博文后能够对windows 下的tracert命令有一定的了解。

2017-08-10 15:24:10 10893 4

原创 配置动态路由:基于RIP v2

这篇博客小编将给大家讲解一下我在东北大学学习互联网课程的时候实验课上学习到的通过RIP v2 来配置动态路由。    (一)实验目的:    掌握在路由器上配置RIP V2。     (二)实验环境:    实验拓扑如下图所示:           (三)实验的内容和要求     首先建立3路由的静态路由,再建立动态路由。    实验说明:

2017-08-08 15:38:49 2726

原创 实验一 路由器配置

小编由于在网络中心任职,所以需要补习一下之前在东北大学研究生学习的计算机网络的知识。今天小编就分享一下我们在校园里面学习以思科路由器为模板路由器配置。    实验目的:    学习静态路由的设计思路,掌握路由器的静态路由的配置方法。    实验环境:    实验拓扑结构如下图所示。        实验的内容和要求:    掌握通过静态路由方式实现网络的连通性

2017-08-08 09:06:29 2310

原创 交换机配置教程

小编由于在未来工作中需要经常进行交换机的配置,所以根据网上的教程以及本科研究生学习的计算机网络知识进行整理出一篇该如何配置交换机的博文。    1.连接电脑。    配置交换机可以使用笔记本以及台式电脑,由于笔记本具有良好的便携性,所以一般在配置交换机的时候都采用笔记本电脑。在交换机上一般都有一个console(配置)端口,该端口用于对交换机配置和管理,将该端口通过网线与笔记本电脑连接,进

2017-08-07 15:20:27 22349 1

原创 HTML的组成

今天小编给大家详细讲解HTML的组成。       头部分 标签: 网页中头部的信息,不用于显示网页的数据。 http-equiv:该属性主要是用于告诉浏览器使用了什么编码解释该网页的内容。 content="text/html;charset=utf-8":告诉浏览网页的内容是以文本格式存在的。解释网页的内容使用了UTF-8编码方式。 -->

2017-08-05 21:28:01 1452

原创 HTML简介

软件结构类别:    1. C /S 结构 Client / Server   客户端服务器结构    举例:腾讯QQ,手机淘宝等    优点: 减轻服务器压力,大部分的运算在客户端。 可以保存个性化的数据。    缺点 需要在客户端进行版本的更新。程序员急需要开发客户端,有需要开发

2017-08-05 19:22:32 1611

原创 wifi能够保护你在虚拟现实中不会丢失

你在家里边头戴一个头戴式显示器,然后正在玩虚拟现实的游戏,,像专业人士一样,躲避僵尸。

2017-08-01 14:32:51 1340

zabbix监控微信报警

ZabbixZabbixZabbixZabbixZabbix 除了可以使用邮件报警 之外, 还可以通过多种方式把告警 信息发送到指定人, 信息发送到指定人, 例如 短信报警方式,越来多的企业开始使用 短信报警方式,越来多的企业开始使用 短信报警方式,越来多的企业开始使用 短信报警方式,越来多的企业开始使用 短信报警方式,越来多的企业开始使用 短信报警方式,越来多的企业开始使用 短信报警方式,越来多的企业开始使用 短信报警方式,越来多的企业开始使用 短信报警方式,越来多的企业开始使用 短信报警方式,越来多的企业开始使用 短信报警方式,越来多的企业开始使用 短信报警方式,越来多的企业开始使用 短信报警方式,越来多的企业开始使用 短信报警方式,越来多的企业开始使用 Zabbixabbixabbixabbix 结合微信作为主要的告警方式, 结合微信作为主要的告警方式, 因为 每个人 每个人 每天都在使用微 每天都在使用微 每天都在使用微 信,这样可以及时有效的把告警信息推送到接收人 ,方便告警的及时 处理。

2018-06-12

ZabbixServer 3.4 CentOS7自动安装脚本

zabbix(音同 zæbix)是一个基于WEB界面的提供分布式系统监视以及网络监视功能的企业级的开源解决方案。zabbix能监视各种网络参数,保证服务器系统的安全运营;并提供灵活的通知机制以让系统管理员快速定位/解决存在的各种问题。本脚本包含 ZabbixServer 3.4 CentOS7自动安装脚本(含数据库分区、微信报警、Grafana)

2018-05-09

Red_Hat_Enterprise_Linux

Red_Hat_Enterprise_Linux-7-7.1_Release_Notes-en-US.pdf 官方英文文档

2017-11-14

apache-solr-ref-guide-7.1.pdf

apache-solr-ref-guide-7.1.pdf为最新的Solr版本的参考手册

2017-11-10

IKAnalyzer2012FF_u1.zip

IKAnalyzer2012FF_u1.zip 是一款非常好用的分词,使用方式可以观看http://edu.csdn.net/course/detail/6031 视频详细讲解

2017-11-08

原型设计工具

Axure——原型设计工具.xure的可视化工作环境可以让 工作环境 工作环境(2张) 你轻松快捷的以鼠标的方式创建带有注释的线框图。不用进行编程,就可以在线框图上定义简单连接和高级交互。在线框图的基础上,可以自动生成HTML(标准通用标记语言下的一个应用)原型和Word格式的规格。

2017-10-27

Hibernate4.0.0.chm

Hibernate.Hibernate是一个开放源代码的对象关系映射框架,它对JDBC进行了非常轻量级的对象封装,它将POJO与数据库表建立映射关系,是一个全自动的orm框架,hibernate可以自动生成SQL语句,自动执行,使得Java程序员可以随心所欲的使用对象编程思维来操纵数据库。

2017-10-20

Java JDK 1.8安装,Nutch版本选择

讲解如何安装JavaJDK1.8,以及如何选取Nutch,Solr,Hadoop,Hbase的版本,来搭建搜索引擎。

2017-10-18

Solr参考文档

apache solr guide 6.6 , solr 6.6 操作向导 用户手册

2017-10-16

jQuery EasyUI v1.3.5官方API中文版

jQuery EasyUI v1.3.5官方API中文版,中文帮助文档。jQuery EasyUI是一组基于jQuery的UI插件集合,而jQuery EasyUI的目标就是帮助web开发者更轻松的打造出功能丰富并且美观的UI界面。

2017-10-16

Linux常用命令全集

Linux常用命令全集,分为文件管理,文件传输,文档编辑,系统管理,系统设置,网络通讯,磁盘管理,磁盘维护,备份压缩,设备管理。

2017-10-13

Jquery文档

jquery开发文档, jQuery 是一个 JavaScript 库。 jQuery 极大地简化了 JavaScript 编程。

2017-10-07

dom中文API

Dom中文文档。文档对象模型(Document Object Model,简称DOM),是W3C组织推荐的处理可扩展标志语言的标准编程接口。

2017-10-07

[Java参考文档].JDK_API_1_6

jdk api 1.6中文版。JAVA API文档是JAVA的应用编程接口,目的是提供应用程序与开发人员基于某软件或硬件的以访问一组例程的能力,而又无需访问源码,或理解内部工作机制的细节。如果开发人员对正在使用的类不熟悉,想查看类里面的变量或者方法,就可以打开Java API文档进行阅读和查看,从而让开发人员迅速地提高能力。

2017-10-07

很全的中文姓名字典.zip

4X108万中国人姓名汉语拼音WPA字典,几乎涵盖所有姓名的拼音,EWSA跑包必需。4X108万中国人姓名汉语拼音WPA字典,EWSA跑包必需。

2017-09-26

汉语人名大全78页

汉语人名大全78页,大概有30000多个中文人名,为系统提供很全的人名字典。汉语人名大全78页,大概有30000多个中文人名,为系统提供很全的人名字典。

2017-09-26

Hadoop-2.4.0+Hbase-0.94.18+Nutch-2.3集中和分布式爬虫配置攻略.docx

使用github中最新的nutch-2.x源码,Hadoop-2.4.0+Hbase-0.94.18+Nutch-2.3配置攻略,在ubuntu14.04上成功运行本地和分布式爬虫。该文档详细描述了三者版本不兼容问题的解决方案以及各个配置文件的详细配置。

2017-09-26

word-1.3.1.jar中文分词

word 分词是一个Java实现的分布式的中文分词组件,提供了多种基于词典的分词算法,并利用ngram模型来消除歧义。能准确识别英文、数字,以及日期、时间等数量词,能识别人名、地名、组织机构名等未登录词。能通过自定义配置文件来改变组件行为,能自定义用户词库、自动检测词库变化、支持大规模分布式环境,能灵活指定多种分词算法,能使用refine功能灵活控制分词结果,还能使用词性标注、同义标注、反义标注、拼音标注等功能。同时还无缝和Lucene、Solr、ElasticSearch、Luke集成。

2017-09-26

IKAnalyzer2012FF_u1.jar

IKAnalyzer2012FF_u1.jar 中文分词,最好用的中文分词器之一。IK Analyzer是一款结合了词典和文法分析算法的中文分词组件,基于字符串匹配,支持用户词典扩展定义,支持细粒度和智能切分

2017-09-26

SolrJ6.3.0

放了SolrJ6.3.0所有web工程下的Jar包。solr-solrj6.3.0.jar等。放了SolrJ6.3.0所有web工程下的Jar包。放了SolrJ6.3.0所有web工程下的Jar包。

2017-09-07

lucene-memory

lucene-memory

2017-08-18

lucene-highlighter-3.0.0.

Lucene搜索的内容进行高亮显示。

2017-08-18

IKAnalyzer

IKAnalyzer非常棒的一款中文分词器,

2017-08-18

lucene-core-3.0.0

lucene全文搜索引擎包。

2017-08-18

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除