自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(18)
  • 收藏
  • 关注

原创 Maven项目如何将自定义文件添加到META-INF目录下

总共两步:第一步:在src/main/resources(必须是资源文件夹)下创建META-INF文件夹,然后将文件放在META-INF下第二步:修改pom.xml,使用maven-jar-plugin插件,不让Maven打包时生成maven自己的描述文件,这样就maven就不会覆盖自定义的文件了参考链接:https://blog.csdn.net/long_long3/article/details/79716468...

2020-12-30 16:10:59 3090

原创 mybatis处理UUID类型数据

关键步骤:自定义能够映射java对象UUID到JdbcType.OTHER的TypeHandler修改mybatis的配置文件,添加自定义的typeHandler项目的文件结构自定义能够映射java对象UUID到JdbcType.OTHER的TypeHandlerpackage com.happylife.core.dao.typehandler;import org.apache.ibatis.type.BaseTypeHandler;import org.apache

2020-12-11 15:42:47 1915

原创 如何使用mybatis generator(基于postgresql)

项目初期,面对大量表的CRUD需求,着实让人着急。不过,最近发现mybatis generator可以自动生成CRUD功能的代码。试了一下,还不错。下面我介绍一下这个功能的用法。关键步骤:创建mybatis generator使用的配置文件调用mybatis generator,并以1#的配置文件作为入参(可选)在springboot环境下需要生成的mapper接口添加@mapper注解(也可以在springboot应用启动处添加@MapperScan注解)由于时间关系,我这里就不一一介绍该功

2020-12-11 15:25:33 3108 1

原创 从零开始创建一个springboot的restful应用

看这篇文章就行了:https://spring.io/guides/gs/rest-service/

2020-12-10 11:33:27 114

原创 git常用操作

Suppose we have three user account: gituser, juan and jerrygituser is used for git remote repositoryjuan is used for dev1jerry is used for dev2(Note: all these three users all sit in the same machine named driver because of the shortage of machine)Let

2020-11-26 15:34:24 95

原创 Maven 知识点总结

Q1: What’s maven?Maven is one project management system which is actually a plugin execution framework where every task is done by its’ pluginsQ2: How many standard life circles does maven usually have?Maven has 3 standard life circles:cleandefault(o

2020-11-24 21:21:59 161

原创 maven的profile切换项目各环境的参数

当开发一个复杂项目时,会涉及到不同的阶段。比如dev, test 及prod阶段。不同阶段,需要不同的环境变量。那么,如何在不改动代码和配置的前提下实现这个功能?maven 的profile这时就派上上了用场。我们以资源文件的copy作为一个例子。资源文件是用来存放程序在运行期间的各种变量。假如,在开发的dev, test 及prod的三个阶段,各阶段涉及到的资源文件内容有所差异。我们的目标是,根据不同的阶段,只需要copy相应阶段的资源文件。假设我文件目录如下:resources下的子文件

2020-11-24 16:05:15 201

原创 无密码访问

假设两台linux主机 A 和B。想要从A ssh到B,但不需要输入密码。做法:1) 在A主机上 运行命令: ssh-keygen -t rsa一路回车2)这样会在当前用户的.ssh文件下生成两个文件:id_rsa id_rsa.pub$ cd ~/.ssh$ lsid_rsa id_rsa.pub3) 假设我们从A登陆到B上,是以主机B上以userb的身份登陆的,像这样ssh userb@B_ip需要拷贝 id_rsa.pub的内容到B主机userb的/home/userb/.ss

2020-11-21 18:06:56 142

原创 Dockerfile中 ENTRYPOINT和CMD的使用

ENTRYPOINT 和CMD一起使用时,CMD可以用来接受 docker run命令传递的变参。看下面例子:文件:DockerfileFROM ubuntu:15.10MAINTAINER xxx@gmail.comENV NAME defaultvalueVOLUME ["/data"]ENV DIRPATH /pathWORKDIR DIRPATH/{DIRPATH}/DIRPATH/{NAME}COPY startup.sh .RUN pwdRUN chmod a+x star

2020-11-20 17:07:39 438

原创 训练数据集含有离群值时岭回归的表现

目的:测试岭回归在含有离群值(outlier)的训练数据集上训练的模型有什么异常行为。结论:训练集中如果有离群值,训练的模型交叉验证的得分比较差, 但模型在实际测试数据中(测试数据没有离群值)并没有表现的那么差。可见岭回归的鲁棒性还是不错的。所以,如果以后碰到类似的情况,大致可以判断出训练数据有离群值。import numpy as npimport matplotlib.pyplot a...

2019-08-16 17:33:36 534

原创 简单线性回归的一般步骤

绘制散点图观察自变量和预测变量的线性或者非线性关系。如果是非线性关系,考虑合适的函数进行数据转换,使之成为线性关系观察立群点。如果存在离群点,考虑是否去掉它。使用最小二乘进行拟合,观察残差图和pp图如果残差和自变量有关系,考虑数据转换进行关系消除。如果残差具有异方差性(heteroscedasticity),可以考虑加权最小二乘法经过上面步骤,如果有需要进行数据转换然后跳转1...

2019-08-06 08:35:57 9310

原创 np.newaxis的用法

np.newaxis的作用是对已有数据增加一个维度:x = np.random.randint(1, 8, size=5)x.shape(5,) #原始唯独x1 = x[np.newaxis, :]x1.shape(1, 5) #维度变为(1,5)x1array([[1, 6, 6, 3, 2]])x2 = x[:, np.newaxis]x2.shape...

2019-07-29 15:43:55 328

原创 数据分布的检验

对于数值型数据,在应用各种算法之前,首要做的了解一些数据的分布,然后根据情况看是否有必要对数据进行变换。了解数据的分布主要有两种手段:从图形的层面感性的认识一下常用的主要有两种方式:直方图和 q-q图。 关于直方图的定义我这里不做过多解释,网上资料很多。q-q图可以参考我的一篇博文:https://blog.csdn.net/lvla_juan/article/details/97235...

2019-07-25 19:23:04 1810

转载 scipy.stats 用法

-- coding: utf-8 --from scipy import statsfrom numpy import randomDistributions常用分布可参考本文档结尾处分布可以使用的方法见下列清单data=random.normal(size=1000)stats.norm.rvs(loc=0,scale=1,size=10,random_state=None) ...

2019-07-25 09:48:23 6108

原创 stats.probplot(QQ图)

这是一种检验样本数据概率分布(例如正态分布)的方法。使用方法如下:fig = plt.figure()res = stats.probplot(train[‘SalePrice’], plot=plt) #默认检测是正态分布plt.show()...

2019-07-25 09:43:38 15912 4

原创 log1p的使用

如果数据非正态,可以使用log1p进行正态化,方便后继的数据处理。可以看出,使用log1p后,数据明显正态化。查看log1p的文档,发现该函数并不是直接对目标数据取对数,而是加1后取对数。log1p(x) == log(x+1)这样的操作,主要是因为当x很小时,log(x)会出错。log(0)Traceback (most recent call last):File “”...

2019-07-24 16:41:27 4117 1

原创 PAC为什么要提前进行标准化

PCA(主成分分析)所对应的数学理论是SVD(矩阵的奇异值分解)。而奇异值分解本身是完全不需要对矩阵中的元素做标准化或者去中心化的。但是对于机器学习,我们通常会对矩阵(也就是数据)的每一列先进行标准化。PCA通常是用于高维数据的降维,它可以将原来高维的数据投影到某个低维的空间上并使得其方差尽量大。如果数据其中某一特征(矩阵的某一列)的数值特别大,那么它在整个误差计算的比重上就很大,那么可以想象...

2019-07-24 15:25:06 929

原创 python数据预处理之数据标准化的几种处理方式使用场景

数据有噪声或者异常,使用标准化数据稳定,或对输出有要求使用归一化参见:https://www.zhihu.com/question/20455227/answer/370658612

2019-07-24 15:11:48 1669

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除