自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(24)
  • 资源 (6)
  • 收藏
  • 关注

原创 Java中堆和栈的分析与区别

堆和栈的区别:堆内存是java内存中的一种,它的作用用于存储java中的对象和数组,当new一个对象或者创建一个数组时,会在堆内存中开辟一段空间,用于存放。堆内存的特点:             1. 先进先出,后进后出             2. 堆内存可以动态的分配内存大小,生存期不必事先告诉编译器,因为它在运行时动态分配的,缺点:由于在运行时动态分配内存,存取速度较慢栈...

2018-08-19 22:00:38 244

原创 事务的特征:

事务的特征:(ACID)原子性(Atomicity):原子性是指事物包含的所有操作要么全部成功,要么全部失败回滚,因此事物的操作如果成功就必须要完全应用到数据库,如果操作失败则不能对数据库有任何影响。一致性(Consistency):一致性是指事物必须使数据库从一个一致状态变换到另一个一致状态,也就是说一个事物执行之前和执行之后都必须处于一致状态。       例如转账:假设用户a和b...

2018-08-14 11:24:30 324

原创 HTTP和TCP的区别

TCP(Transimission Control Protocol 传输控制协议)是一种面向连接的、可靠的、基于字节流的传输层协议。HTTP(HyperText Transfer Protocol)是超文本传输协议。应用最为广泛的网络协议。TCP是底层通讯协议(传输层),定义的是数据传输和连接方式的规范HTTP是应用层协议,定义的是传输数据的内容的规范。是基于TCP连接的。HTT...

2018-08-13 20:08:56 379

原创 二叉树遍历

 前序遍历:前序遍历可以记为根左右,若二叉树为空,则结束返回。前序遍历的规则:(1)访问根节点(2)前序遍历左子树(3)前序遍历右子树中序遍历:中序遍历可以记为左根右,也就是说在二叉树的遍历过程中,首先要遍历二叉树的左子树,接着遍历根节点,最后遍历右子树。同样,在二叉树为空的时候,结束返回。中序遍历的规则:(1)中序遍历左子树(2)访问根节点(3)中序遍...

2018-08-13 14:46:00 148

原创 抽象类和接口的区别

含有abstract修饰符的类即为抽象类,abstract类不能创建实例对象。含有abstract方法的类必须定义为abstract  class,abstract class类中的方法不必是抽象的。abstract class类中定义抽象方法必须在具体(concrete)子类中实现,所以,不能有抽象构造方法或抽象静态方法。如果子类没有实现抽象父类中的所有抽象方法,那么子类也必须定义成...

2018-08-09 20:14:46 148

原创 java基础知识--面向对象--成员变量和局部变量的区别

面向对象:世间万物皆对象用类的形式描述现实中的事物功能=方法属性=变量大象放进冰箱   开门  关门  存大象分析:具体存在的事物:冰箱  大象 class 冰箱{ 开门(){} 关门(){} 存储大象(大象 d){} } class 大象{    } 冰箱 a = new...

2018-07-29 20:16:34 192

原创 java基础知识--继承--多态--String类

String类的获取功能: int length():获取字符串的长度 char charAt(int index):获取指定索引处的字符 int indexOf(int ch):返回指定字符第一次在该字符串出现的索引 why 是 int? 因为97和‘a’---->a int indexOf(String str...

2018-07-29 20:10:25 235

原创 java基础知识--方法重写和方法重载

方法栈 getArea(int i,int j) return i*j; main int a=getArea(5,6) syso(a); 方法和数据共享区 Method Demo.class main() getArea() 程序...

2018-07-26 21:33:17 330

原创 java基础知识复习

平台指的是操作系统。虚拟机包含在jre中。Java程序可以在任何操作系统上运行,一次编写,到处运行,实现跨平台,需要依赖java虚拟机jvm。变量就是内存中的一个空间,可以存储随时改变的数据。变量是内存中装载数据的盒子,你只能用它来存数据和取数据。8个比特位表示一个数据。计算机最小的存储单位,字节,一个字节占有8个比特位。(一个字节占8位)。 1b=8bit ...

2018-07-26 18:01:33 171

原创 hadoop+nutch+mmseg4j

1.  在centos上安装nutch:#  svn co  http://svn.apache.org/repos/asf/nutch/tags/release-1.6/ 检出完成之后,进入nutch的主文件夹: # cd release-1.6 然后进行构建; #ant #ls #ls –l   (生成build和runtime两个文件夹) #ls  runtime  (下...

2018-07-08 20:15:55 192

原创 maven项目报错maven-resources-plugin:2.7 or one of its dependencies could not be resolved

解决办法:1. 修改settings.xml,添加:<mirror>           <id>Central</id>           <url>http://repo1.maven.org/maven2</url>           <mirrorOf>central</mirrorOf>       

2018-06-24 21:39:48 5888 1

原创 maven安装以及在eclipse里面的安装

1. 下载maven包2. 安装配置maven   2.1 将软件放到本地盘的一个目录下   2.2 配置环境变量,创建MAVEN_HOME,值为maven包目录地址             3.在Path变量里添加%MAVEN_HOME%\bin,注意前后分号4.修改maven库地址到指定的目录。打开maven包下的conf文件夹,里的settings.xml文件,把目录指向改为自己指定的库目录...

2018-06-23 23:19:16 208

原创 解决python中pip3不是内部或外部命令,也不是可运行的程序问题

1.检查安装python包中scripts中是否安装pip3.exe2.如果没有,先安装pip3,进入到scripts目录下3.安装requests

2018-06-21 11:05:21 51517 3

原创 windows文件上传到linux服务器上

1 下载一个远程软件xshell,连接上linux服务器2 检查是否安装sz  rz3 如果没有安装4 如果出现下面错误5 进行下面操作6最后在弹出的框中进行上传文件:7 下载...

2018-06-19 22:33:57 28443 5

原创 数据挖掘知识

数据挖掘(数据库中的知识发现):从数量众多、信息模糊、知识随机的实际数据中,提起其中用户感兴趣或有用的信息和知识的过程。数据挖掘主要包括:1.数据:各种文本、web页面、多媒体信息2.模式:通过分析、推理等方法对数据进行“挖掘”,得出其中蕴含的规则和规律以及          论断,称为模式,它具有未知的,潜在有用的以及规则简单等特点。3.数据处理过程:数据挖掘是一个复杂的数据处理过程,其中大部分...

2018-05-25 16:35:41 826

原创 搜索引擎基础

爬虫工作流程:1. 抓取数据2. 数据噪声去重3. 链接提取4. 网页内容提取搜索引擎结构体系的基本模块l 爬虫服务l 索引服务:目录l 缓存服务l 搜索服务l 日志服务 搜索引擎体系技术1. 自然语言处理:利用大数据分析原理及自然语言处理对数据进行文本挖掘2. 知识图谱技术:组成元素:实体  实体标签  实体关系3. 海量数据存储:来源:原始数据、索引数据、日志数据 采用分布式存储技术4. 分布...

2018-05-25 16:31:45 332

原创 数据挖掘基础

数据挖掘起源:需要是发明之母。存在大量数据,可以广泛使用,并且迫切需要将这些数据转换成有用的信息和知识。获取的信息和知识可以广发用于各种应用,如:商务管理、生产控制、市场分析、工程设计、和科学探索。数据挖掘的作用:分类估计预测相关性分组或关联规则聚类描述和可视化复杂数据类型挖掘(text web 图形图像 视频 音频)数据挖掘分类直接数据挖掘 前三个:目标是利用可用的数据建立一个模型,这个模型对剩...

2018-05-25 16:27:04 688

翻译 数据挖掘在搜索引擎中的应用

服务器端:数据挖掘----有效的网页内容获取和精炼的索引数据库建立web数据挖掘是从互联网资源中获取数据信息和发现知识的过程,通常人们应用数据挖掘获取网页有用数据,实现数据抽取。web结构包括页面之间的结构以及页面内部的结构。通过挖掘网络站点结构信息,对于导航用户浏览行为、改进站点整体设计、评价页面的重要性等都非常重要。web结构挖掘需要整个站点的全局数据信息,所以被应用在个性化搜索引擎和主题搜索...

2018-05-23 19:53:30 2889

原创 linux知识整理

vim的可视化模式在命令模式下按“ctrl+v”进入到可视模式在可视模式下可以区域选择字符可视模式下批量添加字符*>> ctrl + v 选中要加入字符所在列*>> 按“i”进入插入模式,写入要加入的字符*>> 按esc...

2018-03-19 10:38:13 117

原创 linux知识整理

vim命令模式下字符的管理字符的复制yl     ##复制一个字母y3l   ##复制三个字母yw   ##复制一个单词y3w  ##复制三个danciyy   ##复制一行y3y  ##复制三行p     ##复制完成后按“p”粘贴2.字符的删除dl   ##删除一个字母d3l   ##删除三个字母dw   ##删除一个单词d3w  ##删除三个单词dd    ##删除一行d3d   ##删除三...

2018-03-19 10:31:01 117

原创 linux知识整理

vim整理1.vim命令模式:set nu    ##添加行号:set nonu   ##取消行号:set mouse=a  ##添加鼠标xuanze:set  cursorline    ##行线显示以上设定都是临时的,永久设定vim  /etc/vimrc  ###次文件为vim的配置文案,在此文件最后加入以上参数,加到文件中的参数不需要2.vim命令模式下关键字搜索/关键字n向下匹配N向上匹...

2018-03-18 20:55:32 94

原创 linux笔记整理

|   管道 ,管道的作用是将前一条命令的输出变成管道后命令的输入ls /bin | wc -l    ##统计ls /bin 命令输出的行数系统中错误的输出是无法通过管道的用 2>&1  可以把错误的输出编号由2变成1tee  复制输出指定位置date  | tee file  | wc -l   ##tee命令复制date命令输出到file中,并统计输出行数...

2018-03-18 20:39:06 92

原创 linux学习笔记整理

在linux系统中,正确输出的编号为1,错误输出的编号为2在系统中用普通用户执行“student” find /etc -name passwd因为student用户权限问题会有一下输出find: ‘/etc/pki/rsyslog’: Permission denied  ##没有进入权力报错find: ‘/etc/audit’: Permission denied/etc/passwd    ...

2018-03-18 20:30:29 152

原创 Java基础知识

ArrayList:底层数据结构是数组,查询快,增删慢;线程不安全,不同步,效率高   Vector:底层数据结构也是数组,查询快,增删慢;线程安全,不同,效率低LinkedList:底层数据结果是链表,查询慢,增删快,线程不安全,不同步,效率高!

2017-11-22 17:28:54 107

利用 Heritrix 构建特定站点爬虫

利用 Heritrix 构建特定站点爬虫

2022-04-24

Python实现网络数据采集

利用Python实现网络数据采集,从基础到精通,适合初学者的学习使用

2019-01-17

Python实现网络爬虫

用Python实现网络爬虫,从入门到精通,适合基础者的学习。

2019-01-16

apache-solr包

solr是一个独立的企业级搜索应用服务器。同时对其进行了扩展,提供了比Lucene更为丰富的查询语言,同时实现了可配置、可扩展并对查询性能进行了优化,并且提供了一个完善的功能管理界面,是一款非常优秀的全文搜索引擎。

2018-07-21

eclipse工具类db.jar

eclipse项目工程建立以及实现的工程中,需要的jar包工具类。

2018-06-23

搜索引擎知识整理与综合,搜索引擎概念整理与综合

搜索引擎知识深入了解,对搜索引擎有深入认识,同时提高技能

2018-05-25

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除