自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

我很帅的专栏

用心做好每一篇博客,点亮每一个知识点

  • 博客(82)
  • 资源 (8)
  • 收藏
  • 关注

原创 DDD领域驱动设计

DDD领域驱动设计初识第一章 DDD关键概念 第二章 领域分析模型第三章 领域设计模型第四章 DDD实战DDD领域驱动设计初识DDD领域驱动设计初识前言一、DDD和MVC比较二、自顶而下逐步求精1.todo总结前言DDD是一种处理高度复杂领域的愿景和方法,他主张在软件项目中把领域本身作为关注的焦点,维护一个对领域有深度认知的软件模型。一、DDD和MVC比较todo二、自顶而下逐步求精todo1.todo代码如下(示例):总结todo...

2021-11-06 00:45:12 816

原创 java通过相对路径读取properties数据

主要是通过getResourceAsStream方法来实现相对路径的读取,相对路径的意思就是以项目所在路径为基准,让程序知道其在项目的哪个路径下面。

2017-01-13 17:52:51 4759

原创 IntelliJ IDEA 导入maven项目并将它及依赖打成jar包

IDEA导入MAVEN项目:IntelliJ IDEA14之后的版本,没有import project选项,需要在File-New-Project form existing sources,然后基本就都知道咋弄了,然后勾上Import maven projects automatically选项,接下来要把SDK配置好,即找到jdk1.8的位置,最后确认。

2017-01-13 17:45:23 14448

原创 DBLP数据集python解析

DBLP是计算机领域内对研究的成果以作者为核心的一个计算机类英文文献的集成数据库系统,按年代列出了作者的科研成果。包括国际期刊和会议等公开发表的论文。DBLP没有提供对中文文献的收录和检索功能,国内类似的权威期刊及重要会议论文集成检索系统有C-DBLP。其并没有把数据保存在数据库中,而是保存在了XML文件中。

2017-01-10 18:00:45 10731 1

原创 JAVA正则表达式

量词+ 至少一次 等价于{1,}? 至多一次 等价于{0,1}* 0到无穷多次 等价于{0,}(“a”.matches(“.”));//.是任意字符(只限一个) T (“aaaa”.matches(“a*”)); 输出T (“aaaa”.matches(“a+”));输出T (“”.matches

2017-01-04 23:55:18 599

原创 一线互联网公司机器学习岗位面试经验

从9月18号开始投实习简历到10月21号,差不多一个月的时间,面了三个互联网公司,有研发岗和算法岗,有的拿到了internship, 也有的被惨虐;会有面试通过的惊喜,也有一轮游的不甘;对结果的无法控制和等待过程中的焦虑,更会有对自身的不自信,相信每个面试的人都经历过,但无论如何实习这件事算是过去了,希望自己在接下来的路依旧不卑不亢,努力前行。

2016-10-21 19:26:40 11479 1

原创 web开发3--cookie&session

一、会话1、定义用户开一个浏览器,点击多个超链接,访问服务器多个web资源,然后关闭浏览器,整个过程称之为一个会话。(只要浏览器不关闭,会话就没有结束,没有与服务器断开)2、会话过程要解决的问题是什么?每个用户在使用浏览器与服务器进行会话的过程中,不可避免各自会产生一些数据,程序要想办法为每个用户保存这些数据。

2016-10-17 09:47:18 499

原创 WEB开发2--request&response

Web服务器收到客户端的http请求,会针对每一次请求,分别创建一个用于代表请求的request对象、和代表响应的response对象。request和response对象即然代表请求和响应,那我们要获取客户机提交过来的数据,只需要找request对象就行了。要向容器输出数据,只需要找response对象就行了。

2016-10-01 11:18:34 790

原创 web开发1——servlet

一. 什么是servlet servlet是服务器端(tomcat)运行的一段java程序(java接口),通过http协议,负责接收和响应web客户端(浏览器)的请求。 先附上servlet家族图谱。 以一个简单servlet小程序,讲述servlet的实现方式:1 编写java类,实现servlet接口,主要实现service方法。 2 配置web.xml文件,给servlet一个

2016-09-26 09:31:14 649

原创 HashMap剖析

这篇文章从源码角度,首先讲述HashMap的底层数据结构(数组+链表),介绍数组的初始容量为什么是16,加载因子为什么是0.75;然后讲述HashMap如何处理冲突;最后讲述多线程下如何使用HashMap。

2016-09-07 20:20:06 1474

原创 java泛型剖析

一 java泛型是什么?泛型的好处是啥? 那些拥有Java1.4或更早版本的开发背景的人都知道, 1> 在集合中存储对象并在使用前进行类型转换是多么的不方便。泛型防止了那种情况的发生。 2> 它提供了编译期的类型安全,确保你只能把正确类型的对象放入集合中,避免了在运行时出现ClassCastException。

2016-08-26 20:43:32 509

原创 HashSet剖析

HashSet底层是HashMap实现,不保证顺序恒久不变。优点是利用哈希表提高查询效率,缺点是元素不能重复。一 哈希表如何提高查询效率Object类中含有hashCode和equals方法,故String类重写了两种方法。其中重写的hashCode方法就相当于下图的hash函数,给对象映射到一个hash值,放到哈希表里,用于在哈希表存放位置的比较。重写的equals方法用于进一步判断对象是否相同,

2016-08-25 08:26:23 1454

原创 treeSet剖析

TreeSet使用元素的自然顺序(暂时理解为unicode顺序)对集合中的元素进行排序。添加的元素必须自己实现Comparable接口,以便排序时默认(源码理解)调用其compareTo方法进行比较,TreeSet本身不须实现Comparable接口。为保证元素唯一性,当有相同元素时,不能往里添加。

2016-08-24 21:26:01 1355

原创 Object类对象剖析

Object是所有类的父类,具备所有对象都能用的共性内容,下面介绍下常用的四种方法。1 boolean equals(Object obj) 顾名思义,这是比较对象是否相等的方法(向上转型)。大家周知道,”==“是用来比较两个对象地址是否相同的方法,那么equals是比较地址还是内容呢?

2016-08-17 10:32:46 522

原创 Iterator原理

Iterator用于遍历集合中的元素,适用于不知道集合内部结构的情况。用户不再与集合类交互,而是与Iterator交互,其清楚知道集合类的内部状态,通过控制iterator达到遍历集合的目的。

2016-08-15 13:06:21 10217 2

原创 如何遍历Map中的对象

众所周知,java中Iterator、Collection和Map都是顶层接口。在遍历集合Collection时,可以使用迭代器Iterator,加快遍历速度。但是对于Map不是集合,内部不含有iterator,那么该如何遍历Map中的对象呢?

2016-08-14 21:53:48 2352

原创 应用反射进行开发

反射机制:运行状态中,对于任何一个类(class文件),都知道此类的所有属性和方法;对于任何一个对象,能调用任意一个属性和方法。简言之:动态获取类中信息。反射运行机制: 程序首先根据类名得到类名.class文件,然后加载进内存里;创建该字节码文件对象;紧接着创建该字节码内部对应的具体类对象。

2016-08-14 16:24:29 645

原创 常用聚类算法以及算法评价

聚类模型是一种非监督的学习方法,聚类的输入是一组未标记的数据,聚类模型根据自身的距离或相似性将其化为若干组,划分的原则是组内距离最小化而组间距离最大化。常见聚类方法见下表: 类别 主要算法 划分方法 k-Means,k-Medoids(k中心点),CLANRANS(基于选择的算法) 层次分析方法 BIRCH(平均迭代规约和聚类),CURE(代表点聚类),CHAMELEON(动态

2016-07-24 17:02:45 6428

原创 决策树、逻辑回归、线性回归使用时注意事项以及模型过拟合策略

决策树缺点和注意事项:决策树的最大缺点是原理中的贪心算法。因此它所做的选择只能是某种意义上的局部最优选择。若目标变量是连续变量,那么决策树就不使用了,改用回归模型若某些自变量的类别种类较多,或者自变量是区间型时,决策树过拟合的危险会增大。这种情况需要分箱或多次模型验证,确保其具有稳定性。对区间型变量进行分箱操作时,无论是否考虑了顺序因素,都有可能因为分箱丧失了某些重要信息,尤其是当分箱前的区

2016-06-27 17:22:41 13165

原创 漫谈deepcopy(深拷贝)和shallowcopy(浅拷贝)

浅拷贝:只复制当前的对象,对该对象内部的引用(其他类对象作为自己的元素-也叫对其他对象的引用)不能复制(在堆内存中从新创建空间,内容相同,但地址不同)。深拷贝:对对象内部的引用均复制,是创建一个新的实例,并复制实例。

2016-06-15 20:23:04 11774 1

原创 利用jws发布一个查询员工信息的Web服务(员工信息存储在数据库中)

这是《基于服务的软件系统》的课程设计:一.作业要求编写查询员工信息的Web服务(员工信息存储在数据库中)。第一个Web服务:输入员工号,返回该员工号的员工的基本信息,包括员工号、员工名称、所在部门、出生日期、职位、职称、入职日期等信息。第二个Web服务:输入部门、职称,返回该部门具有该职称的所有员工的基本信息,员工基本信息与上面相同。分别针对上述两个Web服务,分别编写调用这两个Web服务的程序。

2016-06-13 10:07:01 8816

原创 web服务中soap、wsdl、uddi理解

SOAP,作为传输层,是Web services 的通信协议。用来在消费者和服务提供者之间传送消息。SOAP是一种基于XML 的机制,用于在网络应用程序之间进行结构化数据交换。SOAP中会指定服务端调用的方法,已经调用的参数等。WSDL用来描述服务。它是一个XML 文档,实现SOAP协议,把它写成可供电脑识别的文件。

2016-06-07 11:20:44 2387

原创 leetcode102:Binary Tree Level Order Traversal

Binary Tree Level Order Traversal.Given a binary tree, return the level order traversal of its nodes’ values. (ie, from left to right, level by level).For example:Given binary tree {3,9,20,#,#,15,7},3

2016-05-25 15:11:10 421

原创 匿名类

匿名类(只有类体,没有类声明)分为两种,和类有关的匿名类和与接口有关的匿名类。

2016-05-23 10:13:00 3911 1

原创 适配器模式(Adapter)

适配器模式: 将一个类的接口变换成客户端所期待的另一种接口,从而使原本因接口不匹配而无法在一起工作的两个类能够在一起工作。经常举的例子是插头,插座是2口的,但电器插头是3口的,若想正常使用电器就需要转换插头(3口转2口),这个转换插头就是适配器。

2016-05-20 20:27:47 506

原创 加权中位数应用:油井加权的输油管道位置选取

普通的输油管道问题: 某石油公司计划建造一条由东向西的主输油管道。该管道要穿过一个有n口油井的油田。从每口油井都要有一条输油管道沿最短路经(或南或北)与主管道相连。如果给定n口油井的位置, 即它们的x坐标(东西向)和y坐标(南北向), 应如何确定主管道的最优位置, 使得各油井到主管道之间的输油管道长度总和最小的位置。油井加权的输油管道问题:若考虑每个油井带有一个权重,求解目标变为加权距离和最小。

2016-05-19 20:05:17 795

原创 中位数应用:输油管道问题--快速排序、改进、变种

问题描述:某石油公司计划建造一条由东向西的主输油管道。该管道要穿过一个有n口油井的油田。从每口油井都要有一条输油管道沿最短路经(或南或北)与主管道相连。示意如下所示。如果给定n口油井的位置, 即它们的x坐标(东西向)和y坐标(南北向), 应如何确定主管道的最优位置, 即使各油井到主管道之间的输油管道长度总和最小的位置? 问题分析:问题可以抽象为给定n个点坐标,如何确定一条平行于x轴的直线,使得所有

2016-05-18 19:07:32 1734

原创 leetcode141: Linked List Cycle

Given a linked list, determine if it has a cycle in it.Follow up: Can you solve it without using extra space?大家考虑这样一个问题,链表的环相当于一个圆形操场。假设有两个人在圆形操场上无限循环的跑,那么速度快的一定能追得上速度慢的。

2016-05-17 10:30:24 3238

原创 python用箱型图进行异常值检测

异常值检测:数据挖掘工作中的第一步就是异常值检测,异常值的存在会影响实验结果。异常值是指样本中的个别值,也称为离群点,其数值明显偏离其余的观测值。常用检测方法3σ\sigma原则和箱型图。其中,3σ\sigma原则只适用服从正态分布的数据。在3σ\sigma原则下,异常值被定义为观察值和平均值的偏差超过3倍标准差的值。

2016-05-16 20:52:01 49116 16

原创 leetcode138: Copy List with Random Pointer

A linked list is given such that each node contains an additional random pointer which could point to any node in the list or null.Return a deep copy of the list.

2016-05-12 21:56:09 830

原创 内部类,类修饰符,上转型对象,多态,接口回调

内部类: java支持在一个类中声明另一个类,这样的类称之为内部类,而包含内部类的类称为外部类。内部类的使用方法:可以访问外部类的成员变量和方法。但不可以在自己的类体中声明类变量和类方法。 外部类使用内部类:外部类要想使用内部类里的方法,是通过实例化内部类的对象,然后通过外部类的对象去调用内部类的对象的成员变量和方法。

2016-05-12 21:49:51 590

原创 访问权限:public ,protected ,友好 ,private

*不能用protected和private修饰类,访问权限的级别排列,从高到低是pubic、protected、友好的、private。*public修饰的变量和方法可以被任何类继承或使用protected修饰的变量或方法:**继承**-当前类,同包类,不同包类。**使用**-当前类,同包类。友好修饰的变量和方法只能被当前类,同包类继承或使用。private修饰的变量和方法只能被当前类使用。不存在继承

2016-05-11 17:19:00 3061

原创 leetcode287: Find the Duplicate Number

数组中有n+1个数,范围为1~n,请证明至少存在一个重复的数字。假设只有一个重复的数,请找出这个数。假设n=4,那么数组中应该有5个数,每个数的范围为1~4且只有一个重复的数字。数组在放完1 2 3 4 后,如果在放一个数字的话必然会产生重复,目的就是找出这个重复的数字。要求:不要更改数组(限制你不要排序)不要使用额外的空间(不要创建新的数组)时间复杂度小于O(n$^2$)

2016-05-11 11:39:49 449

原创 创建二叉树:层次遍历--树的宽度高度,后序遍历--祖先节点

创建二叉树,遍历二叉树.详细介绍了层次遍历和后序遍历的应用. 层次遍历:树的高度,树的宽度,每一层节点个数等 后序遍历:根节点到某节点的路径,两个节点的最近公共祖先等.

2016-05-06 14:42:15 1064

原创 字符串处理:下划线,多空格变单空格,统计单词出现个数

假设用户输入的字符串只有小写字母,空格和数字,请编写程序对用户输入的串进行处理,规则如下:把每个单词的首字母变为大写把数字与字母之间用下划线字符”_”分隔开把单词间有多个空格的调整为一个空格统计处理后的字符串每个单词出现次数输入: we are we 2family2 输出: We Are We 2_family_2思路:

2016-05-04 13:31:32 781

原创 leetcode151: symmetric tree

Given a binary tree, check whether it is a mirror of itself (ie, symmetric around its center).判断一颗二叉树是否是对称的。

2016-04-30 21:03:32 510

原创 SVD矩阵分解考虑时间因素

推荐系统种矩阵分解有着不错的效果,其中SVD(Singular Value Decomposition)奇异值矩阵分解也是常用的一种方法,通过对原始矩阵进行SVD分解后,可以将原始高纬数据映射到低维空间,在降维过程中,其关注的是如何去除噪声和保留更多有效信息。其优点:简化数据,去除噪声,提高算法结果 缺点:分解过程和实际业务执行过程匹配不上 适用数据类型:数值型。

2016-04-29 20:11:40 3943 1

原创 leetcode260-single number iii

题目: Given an array of numbers nums, in which exactly two elements appear only once and all the other elements appear exactly twice. Find the two elements that appear only once.For example:Given nums

2016-04-29 20:07:10 480

原创 Git和github使用方法总结

Git是一个版本控制系统,用于跟踪文件随时间变化状态的一款软件。更具体的说,git是一个分布式的版本控制系统,在git中参与项目的每程序员不仅能拥有文件的当前状态,还能拥有项目的完整历史记录。

2016-04-29 11:43:36 3835

原创 KNN

KNN(K-NearestNeighbor)是分类算法中最简单的一种,用来计算特征的相似性。以电影评分系统为例,每个电影都会有一个评分向量,每部电影也都有一个类标签-动作、爱情等。通过KNN算法可以计算出不同电影之间的评分向量的距离,以此来判断不同电影间的相似性,当有一部新电影进来时,就可以将其归为最相似电影所属的那一类。本文首先介绍KNN(K-近邻)算法的原理,然后给出其实现的伪代码,最后给出java代码。

2016-04-28 21:34:54 1174

天池大神机器学习岗面试资料

这是天池大数据竞赛排名top10的大神Bryan,他亲身经历的各大互联网公司的面试,整理出的一套相对完整的机器学习岗位面试资料。涉及到了面试的方方面面,与大家分享下。

2016-10-21

基于cookie显示用户浏览记录

- 项目需求: 设计一个可以根据cookie显示用户浏览记录的图书网站。要求设计出三个界面,登录界面、网站主页和图书详细信息界面。用户成功登录后,进入图书网站,网站会显示当前所有图书,以及该用户最近浏览过的图书。当用户点击某本图书后,进入图书详细信息界面,同时用户最近浏览记录里会增加这本书。 - 实现思路: 按照需求共三个界面,所以可设计三个servlet,每个界面对应一个。 登录界面:写一个form表单,提取用户名和密码,如果正确则通过action跳转到网站主页,错误,提示用户重新输入。 网站主页:核心。主页分成上下两部分,上部分是显示当前所有图书的名字,而且是以超链接的形式,当用户点击某本图书后,会跳转到图书详细信息界面上。下半部分是用户最近浏览的图书,通过读取浏览器的cookie数据,将符合条件的图书名字显示到主页上。 图书详细信息界面:当用户点击超链接后,显示该图书详细信息,然后把该图书编号id及书名name写入到cookie中,返回给浏览器。

2016-10-14

反射在实际开发中的应用

本段代码是在学习了反射相关知识后,结合实际开发经验,以一个简单demo讲述开发中是如何利用发射进行开发。 主要包含以下三个知识点:1.以tomcat为例,讲述其基于反射运行的原理。2. 反射的三种实现方式--获取字节码对象的三种方法。 3.获取class的 字段(field)4.获取class的方法(Method)。

2016-08-14

xgboost在windows下的安装

在windows安装xgboost,本人亲测,有用。

2016-04-25

winows下python安装xgboost的包

由于xgboost的作者在github上删除了xgboost在windows系统下的目录文件,所以导致大家无法安装xgboost。本人通过亲自实践,教大家一步步在win下安装xgboost,这个是之前的xgboost的C++版本,是在python使用xgboost之前必须的包。

2016-03-18

单链表反转

单链表反转是面试时经常会遇到的问题,之前只是在数据结构里用伪代码实现过单链表反转。为落实亲手编写每一个程序的目标,在这里用java实现反转。方法有很多,这里只写最优的。时间复杂度O(n),空间复杂度O(1)。也就是说不新开辟空间,原地反转。

2016-02-27

随身云数据挖掘竞赛解题思路ppt

前阵子参加牛客网举办的数据挖掘竞赛,数据源源自中华万年历的“生活圈”数据,类似于朋友圈,用户可以发表各种帖子,也可以对帖子内容进行赞踩等行为。数据内容是用户11月份的帖子浏览记录,以及前27天对帖子的赞踩记录,共约8G。 目标任务是根据用户11月份的浏览记录,以及前27天赞踩记录,挖掘出用户的个人喜好,然后预测用户对月末28,29,30这三天出现的帖子的赞踩行为。 本文给出解题思路及数据来源。

2016-01-23

考研的经验分享

这是一篇关于考研经验分享的ppt,在这里我清晰的描述了考研的基本流程,以及考研过程中的收获与建议。

2015-10-26

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除