那么在对Maven有了一点接触后,接下去的一步是要了解Maven的核心概念,这样才能在使用maven的时候游刃有余。
接下来我们介绍下面这几个核心概念:
Maven坐标
Maven仓库
POM(Project Object Model)
Maven插件
Maven生命周期
Maven依赖管理
Maven坐标
为什么要定义Maven坐标
在我们开发Maven项目的时候,需要为其定义适当的坐标,这是Maven强制要求的。在这个基础上,其他
Maven项目才能应用该项目生成的构件。这个在前面我们已经遇到过,就是maven02项目使用maven01项目的
HelloWorld类,在maven02的项目中的pom.xml配置是这样写的:
<?xml version="1.0" encoding="UTF-8"?>
<project xmlns="http://maven.apache.org/POM/4.0.0"
xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
xsi:schemaLocation="http://maven.apache.org/POM/4.0.0
http://maven.apache.org/maven-v4_0_0.xsd">
<modelVersion>4.0.0</modelVersion>
<!-- groupId的值是项目的包名 -->
<groupId>com.demo.maven02</groupId>
<!-- artifactId的值是模块名 -->
<artifactId>maven02-util</artifactId>
<!-- version的值是版本 -->
<version>0.0.1SNAPSHOT</version>
<dependencies>
<!-- 导入Junit依赖 -->
<dependency>
<groupId>junit</groupId>
<artifactId>junit</artifactId>
<version>4.10</version>
</dependency>
<!-- 导入maven01-model依赖 -->
<dependency>
<groupId>com.demo.maven01</groupId>
<artifactId>maven01-model</artifactId>
<version>0.0.1SNAPSHOT</version>
</dependency>
</dependencies>
</project>
Maven的一个核心的作用就是管理项目的依赖,引入我们所需的各种jar包等。为了能自动化的解析任何一个Java
构件,Maven必须将这些Jar包或者其他资源进行唯一标识,这是管理项目的依赖的基础,也就是我们要说的坐标。
包括我们自己开发的项目,也是要通过坐标进行唯一标识的,这样才能才其它项目中进行依赖引用。
何为Maven坐标
关于坐标(Coordinate),大家最熟悉的应该就是数学中的坐标了吧,我印象不是特别深刻,说的数学专业一点
叫作平面几何。在一个平面坐标系中,有x轴和y轴,x轴就是横线,y轴就是竖线,坐标(x,y)表示这个点距离x轴为y,
距离y轴为x的一点,任何一个坐标都能唯一标识该平面中的一点。
在实际的生活中,我们可以将地址看成是一种坐标。不同的省,不同的市,不同的区,不同的街道等一系列信息
标识了每一个不同的地址。在深圳经常吃外卖的人应该是有体会的,送外卖的小哥都会根据你填写的地址将外卖送给
你,而你填的地址就标识了唯一的一个地址。
坐标就好比每一个Java构件的身份证一样。Maven的世界是拥有非常多的Java构件的,可能是jar、可能是war、
也可能是其他的一些东西。假如Maven中没有坐标的概念,我们是无法来区分这些构件的,所以我们要唯一标识每一
个构件。不然就和传统的手工方式一样,你需要spring就去spring下载spring的包,需要mysql又去mysql下载
mysql的包,没有统一的规范又怎么能够自动化的去依赖这些构件。
Maven便给我们制定了一套规则那就是使用坐标进行唯一标识。Maven的坐标元素包括groupId、artifactId、
version、packaging、classfier。只要我们提供正确的坐标元素,Maven就能找到对应的构件,首先去你的本地仓
库查找,没有的话再去远程仓库下载。如果没有配置远程仓库,会默认从中央仓库地址
(http://repo1.maven.org/maven2)下载构件,该中央仓库包含了世界上大部分流行的开源项目构件,但不一定所有
构件都有,我在以前的开发中就遇到过找不到oracle数据库jar包的问题,不知道现在是否依然如此。
Maven坐标详解
Maven坐标为各种构件引入了秩序,任何一个构件都必须明确定义自己的坐标,通过坐标作为其唯一标识,而一
组Maven坐标是通过一些元素定义的,它们是groupId,artifactId,version,packaging,class-sifer。需要注意的是
groupId、artifactId、version、packaging是必须定义的,classifier是不能被直接定义的,因为附属构件不是项目
直接默认生成的,而是由附加的插件帮助生成的。
这样的坐标我们可在pom.xml配置文件中找到,下面是一组坐标定义:
下面讲解一下各个坐标元素:
groupId
定义当前Maven项目隶属的实际项目。首先,Maven项目和实际项目不一定是一对一的关系。比如
SpringFrameWork这一实际项目,其对应的Maven项目会有很多,如spring-core,spring-context等。这是由于
Maven中模块的概念,因此,一个实际项目往往会被划分成很多模块。其次,groupId不应该对应项目隶属的组织或
公司。原因很简单,一个组织下会有很多实际项目,如果groupId只定义到组织级别,而后面我们会看到,artifactId
只能定义Maven项目(模块),那么实际项目这个层次将难以定义。最后,groupId的表示方式与Java包名的表达方
式类似,通常与域名反向一一对应。
artifactId
该元素定义当前实际项目中的一个Maven项目(模块),推荐的做法是使用实际项目名称作为artifactId的前
缀。比如上例中的helloworld。
version
该元素定义Maven项目当前所处的版本。
packaging
该元素定义Maven项目打包的方式,首先,打包方式通常与所生成构件的文件扩展名对应,如上例中的
packaging为jar,最终的文件名为helloworld-1.0-SNAPSHOT.jar。也可以打包成war, ear等。当不定义packaging
的时候,Maven会使用默认值jar。
classifier
该元素用来帮助定义构建输出的一些附件。附属构件与主构件对应,如上例中的主构件为helloworld-1.0-
SNAPSHOT.jar,该项目可能还会通过一些插件生成如helloworld-1.0-SNAPSHOT-javadoc.jar,helloworld-1.0-
SNAPSHOT-sources.jar, 这样附属构件也就拥有了自己唯一的坐标。
Maven仓库
仓库中jar包定位
在maven世界中任何一个依赖、插件或者项目构建的输出都可以称为构件,任何一个构件都有一个坐标作为唯一
的标识。
这个坐标就是:group、artifactId、version;根据这个坐标就可以定义其在仓库的唯一存储路径,那么就可以
在项目中引用。
Maven仓库原理
Maven仓库是基于简单文件系统存储的,只要在文件系统中没有发现相关的文件,说明这依赖并不存在,因
此,我们很容易在本地仓库查找具体的依赖是否存在。
在Maven中,任何一个依赖、插件或者项目构建的输出,都可以称之为构件。Maven在某个统一的位置存储所有
项目的共享的构件,这个统一的位置,我们就称之为仓库(仓库就是存放依赖和插件的地方)。
任何的构件都有唯一的坐标,Maven根据这个坐标定义了构件在仓库中的唯一存储路径。
解读Maven在仓库中的存储路径:
1.基于groupId准备路径,将句点分隔符转成路径分隔符,就是将 "." 转换成 "/" ; example: org.testng ---
>org/testng
2.基于artifactId准备路径,将artifactId连接到后面:org/testng/testng
3.使用version准备路径,将version连接到后面:org/testng/testng/5.8
4.将artifactId于version以分隔符连字号连接到后面:org/testng/testng/5.8/tesng-5.8
5.判断如果构件有classifier,就要在第4项后增加分隔符连字号 再加classifier,org/testng/testng/5.8/tesng-
5.8-jdk5
6.检查构件的extension,如果extension存在,则加上句点分隔符和extension,而extension是由packing决定
的,org/testng/testng/5.8/tesng-5.8-jdk5.jar
到这里我们就明白了Maven 对于构件存储的细节。
Maven 仓库的分类
Maven的仓库只有两大类:本地仓库和远程仓库
本地仓库就是我们自己机器上的文件系统,所以他是唯一的,项目构建时首先在本地仓库查找依赖,如果本地没
有依赖时才会去寻找远程仓库。
远程仓库指的是非本地的其他所有仓库,中央仓库、私服等都是远程仓库的一种。如果本地仓库没有项目构建需
要的构件,你们就会从远程仓库下载,可是远程仓库如果也没有的话,你们就会项目报错。
本地仓库设置
maven的本地仓库,在安装maven后并不会创建,它是在第一次执行maven命令的时候才被创建。
maven本地仓库的默认位置:无论是Windows还是Linux,在用户的目录下都有一个.m2/repository/的仓库目
录,这就是Maven仓库的默认位置。
更改maven默认的本地仓库的位置:这里要引入一个新的元素:localRepository,它是存在于maven的
settings.xml文件中,更改配置用户范围的本地仓库:先在/.m2/目录下创建settings.xml文件,然后在
~/.m2/settings.xml,设置localRepository元素的值为想要的仓库地址。
这时候,maven的本地仓库地址就变成了 E:/Java/develop/maven/m2/repository,此时配置的maven的本地
仓库是属于用户范围的。
更改配置全局范围的本地仓库:在M2_HOME/conf/settings.xml中更改配置,更改配置的方法同上。此时更
改后,所有的用户都会受到影响,而且如果maven进行升级,那么所有的配置都会被清除,所以要提前复制和备份
M2_HOME/conf/settings.xml文件。这时候需要复制一份setting.xml配置文件到E:/Java/develop/maven/m2/
下。
远程仓库
中央仓库
说到远程仓库先从 最核心的中央仓库开始,中央仓库是默认的远程仓库,maven在安装的时候,自带的就是中央
仓库的配置,Maven必须知道至少一个可用的远程仓库,才能执行Maven命令的时候下载到需要的构件。中央仓库
就是这样一个默认的远程仓库,Maven安装文件自带远程仓库的位置是:http://repo.maven.apache.org/maven2
所有的maven项目都会继承超级pom,具体的说,包含了下面配置的pom我们就称之为超级pom,在Maven的
安装目录下的lib目录下有一个maven-model-builder-3.3.9.jar,用解压软件打开,org\apache\maven\model下
有个pom-4.0.0.xml文件:
我们可以复制出来一份打开,具体中央仓库在settings.xml文件的配置如下:
中央仓库包含了绝大多数流行的开源Java构件,以及源码、作者信息、SCM、信息、许可证信息等。一般来说,
简单的Java项目依赖的构件都可以在这里下载到。
私服
私服是一种特殊的远程仓库,他是架设在局域网内的仓库服务,私服代理广域网上的远程仓库,供局域网内的
Maven用户使用。当Maven需要下载构件的时候,它从私服请求,如果私服上不存在改构件,则从外部的远程仓库
下载,同时缓存在私服之上,然后为Maven下载请求提供服务,另外,对于第三方的jar无法从仓库下载(JDBC驱
动)可以从本地上传到私服供客户端下载。
优点主要有:
1)节省外网宽带
2)加速Maven构建
3)部署第三方构件
4)提高稳定性、增强控制:原因是外网不稳定
5)降低中央仓库的负荷:原因是中央仓库访问量太大
当前主流的maven私服:
1.Apache的Archiva
2.JFrog的Artifactory
3.Sonatype的Nexus
远程仓库配置
配置远程仓库将引入新的配置元素:<repositories> <repository>
在<repositories>元素下,可以使用 <repository>子元素声明一个或者多个远程仓库。例子:
<updatePolicy>元素:表示更新的频率,值有:never, always,interval,daily, daily 为默认值
<checksumPolicy>元素:表示maven检查和检验文件的策略,warn为默认值
有时候登录一个远程仓库需要用户名和密码进行身份验证,所以,需要远程仓库认证。配置认证信息和配置仓库
信息不同,仓库信息可以直接配置POM文件中,但是认证信息必须配置在settings.xml文件中,目的就是安全性。当
然,我们可以把仓库信息配置在settings.xml 中,这样的缺点就是好动态控制仓库,但是一般情况下不会改变仓库,
我们本地私服一般都是唯一的。
值得注意的是,ID代表的是某个repository元素配置的ID。
镜像
如果仓库X可以提供仓库Y存储的所有内容,那么就可以认为X是Y的一个镜像,某些情况下使用镜像可以提高项
目构建效率。
settings.xml 中配置镜像:
镜像的意思是,当你访问mirrorOf的仓库时,就会转到对应的镜像url中请求对应的资源。一般镜像都是和私服结
合使用。由于私服可以代理任何外部的公共仓库(包括中央仓库),因此,对于组织内部的Maven用户来说,使用一
个私服地址就等于使用了所有需要的外部仓库,这个可以将配置集中到私服,从而简化Maven本身的配置。在这种情
况下,任何需要的构件都可以从私服中获得,私服就是所有仓库的镜像。我使用的阿里镜像如下配置:
仓库中jar包搜索
1)仓库搜索:
使用到最多的就是:http://search.maven.org/
其他的仓库
2)中央仓库
http://repo1.maven.org/maven2/
http://repository.jboss.com/maven2/
http://repository.sonatype.org/content/groups/public/