自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(23)
  • 资源 (6)
  • 问答 (1)
  • 收藏
  • 关注

转载 Flyway Validate failed:migration checksum mismatch for migration 1.0.0003

今天在server端跑flyway的时候遇到这个问题,简单的总结一下:首先看一下Flyway的官网介绍https://flywaydb.org/getstarted/how在使用flyway的时候,简单的流程: 新建一个数据库当配置好flyway的基本信息后,运行flyway,会在数据库表中默认新建一个数据表,用于存储flyway的运行信息,默认的数据库名:

2017-06-07 20:54:26 3162

原创 mac上命令行的快捷键和vim的快捷键

mac上的终端(iterm2)新建标签:command + t关闭标签:command + w切换标签:command + 数字 command + 左右方向键切换全屏:command + enter查找:command + f垂直分屏:command + d水平分屏:command + shift + d切换屏幕:c

2017-06-07 20:33:15 7694

原创 Java基础-类加载顺序

类加载过程类从被加载到虚拟机内存中开始,到卸载出内存为止,它的整个生命周期包括:加载(Loading)、验证(Verification)、准备(Preparation)、解析(Resolution)、初始化(Initialization)、使用(Using)和卸载(Unloading)7个阶段。其中准备、验证、解析3个部分统称为连接(Linking)。如图所示。加载、验证、准备、初

2017-05-05 10:24:57 509

原创 hashMap和hashTable的区别

HashMap和Hashtable的比较是Java面试中的常见问题,用来考验程序员是否能够正确使用集合类以及是否可以随机应变使用多种思路解决问题。HashMap的工作原理、ArrayList与Vector的比较以及这个问题是有关Java 集合框架的最经典的问题。Hashtable是个过时的集合类,存在于Java API中很久了。在Java 4中被重写了,实现了Map接口,所以自此以后也成了Java

2017-04-27 18:22:11 215

原创 抽象类和接口的区别

(一)语法层次123456789public abstract class People {  //关键词abstract,声明该类为抽象类    void Num();          abstract void Name();    //声明该方法为抽象

2017-04-27 18:20:20 253

原创 SVM的理解

今天上午刚刚面了滴滴出行的新锐计划,面试官问道svm的两个参数,感觉自己答的不好,回顾一下:支持向量机的大致分为上述3类,线性可分支持向量机使分割直线(二维),平面(三维)、超平面(高维)使类间的距离最大化,对于无法用直线,平面完全分割的数据,我们允许稍微存在一点误差也就是软间隔对大化,非线性支持向量机是在上述两种支持向量机中引入核函数。高维数据怎么判断线性可分呢?不管原始

2017-04-26 13:54:30 724

原创 java面向对象的特性

封装封装性就是尽可能的隐藏对象内部细节,对外形成一道边界,只保留有限的接口和方法与外界进行交互。封装的原则是使对象以外的部分不能随意的访问和操作对象的内部属性,从而避免了外界对对象内部属性的破坏。可以通过对类的成员设置一定的访问权限,实现类中成员的信息隐藏。private:类中限定为private的成员,只能被这个类本身访问。如果一个类的构造方法声明为private,则其它类不能生成该

2017-04-24 22:28:26 265

原创 工程中常用的特征选择方法

当数据预处理完成后,我们需要选择有意义的特征输入机器学习的算法和模型进行训练。为什么?(1)降低维度,选择重要的特征,避免维度灾难,降低计算成本(2)去除不相关的冗余特征(噪声)来降低学习的难度,去除噪声的干扰,留下关键因素,提高预测精度(3)获得更多有物理意义的,有价值的特征不同模型有不同的特征适用类型?(1)lr模型适用于拟合离散特征(见附录)(2)gbdt模型

2017-04-24 19:27:27 2305

原创 正则化理解

1、概念L0正则化的值是模型参数中非零参数的个数。L1正则化表示各个参数绝对值之和。L2正则化标识各个参数的平方的和的开方值。2、先讨论几个问题:1)实现参数的稀疏有什么好处吗?一个好处是可以简化模型,避免过拟合。因为一个模型中真正重要的参数可能并不多,如果考虑所有的参数起作用,那么可以对训练数据可以预测的很好,但是对测试数据表现性能极差。另一个好处是参数变少可以使整个模型

2017-04-24 16:53:19 4607

转载 【机器学习基础】非线性变换

数据变化的意义

2017-04-24 16:37:40 877

原创 特征工程大满贯(一)

特征工程的流程以及详细步骤

2017-04-24 10:36:43 630

原创 Yarn框架的详解,MRv1的区别

原 MapReduce 程序的流程及设计思路:1、首先用户程序 (JobClient) 提交了一个 job,job 的信息会发送到 Job Tracker 中,Job Tracker 是 Map-reduce 框架的中心,他需要与集群中的机器定时通信 (heartbeat), 需要管理哪些程序应该跑在哪些机器上,需要管理所有 job 失败、重启等操作。2、TaskTracker 是 Map

2017-03-09 13:24:20 1374

原创 面试中重要的排序算法

/** * 二分查找,找不到则返回一。 * @param a * @param key * @return */public static int binarySearch(int[] a,int key){ int low =0,high=a.length-1; while (low<=high) { int mid = (low+high)/2;

2017-03-08 22:08:37 258

原创 Hadoop 框架理解

鲁棒性数据磁盘故障、心跳和重新复制每一个DataNode向NameNode定期发送心跳消息。网络分区可以导致datanode的子集与NameNode失去连接。NameNode通过心跳检测这种情况的消息。datanode最近没有心跳,NameNode认为该datanode死亡,并且不向它推送任何的新的IO请求。死亡的DataNode上任何数据对于HDFS不可用。DataNode死亡可能会导致

2017-03-07 14:59:39 466

原创 jvm理解

下面我们来看一下几种垃圾收集算法1、在JDK1.2之前,使用的是引用计数器算法,即当这个类被加载到内存以后,就会产生方法区,堆栈、程序计数器等一系列信息,当创建对象的时候,为这个对象在堆栈空间中分配对象,同时会产生一个引用计数器,同时引用计数器+1,当有新的引用的时候,引用计数器继续+1,而当其中一个引用销毁的时候,引用计数器-1,当引用计数器被减为零的时候,标志着这个对象已经没有引用了,可以

2017-03-06 15:23:09 245

原创 JVM虚拟机的理解

下面我们来看一下几种垃圾收集算法1、在JDK1.2之前,使用的是引用计数器算法,即当这个类被加载到内存以后,就会产生方法区,堆栈、程序计数器等一系列信息,当创建对象的时候,为这个对象在堆栈空间中分配对象,同时会产生一个引用计数器,同时引用计数器+1,当有新的引用的时候,引用计数器继续+1,而当其中一个引用销毁的时候,引用计数器-1,当引用计数器被减为零的时候,标志着这个对象已经没有引用了,可以

2017-03-06 14:16:13 191

原创 修改maven镜像,镜像和仓库的区别

maven中mirror和reposity的区别    | This is a list of mirrors to be used in downloading artifacts from remote repositories.   |   | It works like this: a POM may declare a repository to use in resol

2017-01-28 16:31:38 894

原创 Linux常用命令

1、cd命令这是一个非常基本,也是大家经常需要使用的命令,它用于切换当前目录,它的参数是要切换到的目录的路径,可以是绝对路径,也可以是相对路径。如:cd /root/Docements # 切换到目录/root/Docementscd ./path          # 切换到当前目录下的path目录中,“.”表示当前目录  cd ../path         # 切换到上层

2017-01-06 09:07:44 184

原创 数据分析里面的一些常用指标的特点(最大、最小、平均、中位数、....)

处理空值的技巧空值处理的第一种思路是“用最接近的数据来替换它”。这并不是意味着拿它相邻的单元格来替换,而是你需要寻找除了空的这个单元格,哪一行数据在其他列上的内容与存在空值的这行数据是最接近的,然后用该行的数据进行替换。这种方式较为严谨,但也比较费事。第二种思路是针对数值型的数据,若出现空值,我们可以用该列数值型数据的平均值进行替换。如果条件允许,我建议采用众数进行替换,即该列数据当中出现

2017-01-05 22:48:50 17946

原创 Python环境配置

安装Python2.7.9(Python3.x版本的文档不成熟)安装numpy:pip install numpy(安装不成功的话更新pip,pip install --upgrade pip)安装pandas :pip install pandas上述安装如果出现http****错误,请再次安装。安装scipy,需要安装VCForPython,http://www.microso

2016-12-23 21:22:44 523 1

原创 eclipse配置mr local模式

eclipse配置mr local模式

2016-11-23 14:13:30 346

原创 美团和当当推荐系统文章

http://www.csdn.net/article/2015-10-16/2825925http://www.csdn.net/article/2015-08-13/2825455美团和当当推荐系统文章

2015-10-16 16:06:15 337

转载 朴素贝叶斯算法解析与应用

Preface       本文缘起于最近在读的一本书-- Tom M.Mitchell的《机器学习》,书中第6章详细讲解了贝叶斯学习的理论知识,为了将其应用到实际中来,参考了网上许多资料,从而得此文。文章将分为两个部分,第一部分将介绍贝叶斯学习的相关理论(如果你对理论不感兴趣,请直接跳至第二部分基于朴素贝叶斯分类器的文本分类算法(下)>>)。第二部分讲如何将贝叶斯分类器应用到中文文本分类,随

2015-07-30 12:36:47 816

树的基本操作,哈夫曼树,哈弗曼码

本程序是有关树的基本操作如:遍历,求叶子节点,深度等等,这是作为初学者我自己调试的C++代码,里面有注释,简单易懂,希望对你们有帮助!

2012-12-16

离散数学耿素云第三版课后习题答案

离散数学耿素云第三版课后习题答按,附带习题解析和习题总结的技巧!

2012-12-09

三元组的实现

三元组是学数据结构的第一个实验,一定好好做

2012-12-09

求一个数组的两个最小数,并返回下标

求一个数组的最小值,并返回对应最小值下表

2012-12-09

数据结构-树

树的基本操作,遍历,构造哈夫曼树,求哈弗曼编码,

2012-12-09

栈的基本操作的实现

这个代码对初学数据结构者很有用,容易理解

2012-10-22

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除