使用 node-glob 进行文件处理

glob 工具基于 javascript . 它使用了 minimatch 库来进行匹配
node 的 glob 模块允许你使用 * 等符号, 来写一个 glob 规则,像在 shell 里一样,获取匹配对应规则的文件.

用法:

首先下载 glob 包:

npm install glob

调用格式:

var glob = require("glob")

// options 是可选的
glob("**/*.js", options, function (er, files) {
//
  // files 是匹配到的文件的数组
  // 如果 `nonull` 选项被设置为true, 而且没有找到任何文件,那么files就是glob规则本身,而不是空数组
  // er是当寻找的过程中遇的错误
})

“globs” 就是模型,比如当你在命令行里输入ls *.js, 又或者是你在 .gitignore 文件里写的 bulid/* 这些.

在解析路径模型的时候, 大括号里用多个逗号隔开的内容会被展开, 里面的部分也可以包含"/" ,比如 a{/b/c, bcd} 会被展开成 a/b/c 和 abcd

路径中的某一段可以使用下面的这些字符表示,他们各自都有很炫的作用:

  1. * : 匹配该路径段中0个或多个任意字符:
*:匹配路径中某部分:0个或多个字符

glob("js/*.js",function (er, files) {
    console.log(files)
})

获取js目录下的所有js文件.(不包括以'.'开头的文件)
  1. ? : 匹配该路径段中1个任意字符:
?:匹配路径中某部分:1个字符

glob("js/?.js",function (er, files) {
    console.log(files)
})

获取js目录下所有名字只有1个字的js.
  1. [...] : 匹配该路径段中在指定范围内字符:
    注意不能组合,只能是其中一个字符
[]:匹配路径中某部分:指定的范围

glob("js/a[0-3].js",function (er, files) {
    console.log(files)
})

获取js目录下a开头,第二个字符为0-3之间(包括03)的js(a03.js不能被匹配到)
  1. *(pattern|pattern|pattern) : 匹配括号中多个模型的0个或多个或任意个的组合
    注意|前后不能有空格
*(pattern|pattern|pattern): 匹配路径中的某部分: 多个模型中的0个或多个.
除了三个模型本身,如果是组合也可以,比如ab.js,但是仅仅包含某个模型是不行的,比如a4.js.

glob("js/*(a|a1|b).js",function (er, files) {
    console.log(files)
})

获取js目录下a.js,a1.js,b.js,或者a,a1,b这几个字符的组合的js,比如ab.js
  1. !(pattern|pattern|pattern) : 匹配不包含任何模型
    需要注意: !(pattern|pattern|pattern) 不等于 !(*(pattern|pattern|pattern))
!(pattern|pattern|pattern): 匹配路径中的某部分: 不包含任何模型.
带有a或者b的,都排除.需要注意的是,它并非是*(a|b)的取反

glob("js/!(a|b).js",function (er, files) {
    console.log(files)
})

获取js目录下名字中不包含a,也不包含b的所有文件.
  1. ?(pattern|pattern|pattern) : 匹配多个模型中的0个或任意1个.
    它和 4 的区别是,不可以组合.必须完全匹配
?(pattern|pattern|pattern): 匹配路径中的某部分: 多个模型中的0个或1.
精确匹配模型,不可以组合.

glob("js/?(a|a2|b).js",function (er, files) {
    console.log(files)
})

获取js目录下a.js,a2.js,b.js
  1. +(pattern|pattern|pattern) : 匹配多个模型中的1个或多个.
    它和 4 的区别是,必须有一个,为空不匹配
+(pattern|pattern|pattern): 匹配路径中的某部分: 多个模型中的1个或多个.
可以是任意一个模型,也可以是他们的组合,比如ab.js

glob("js/+(a|a1|b).js",function (er, files) {
    console.log(files)
})

获取js目录下a.js,a1.js,b.js,或者a,a1,b这几个字符的组合的js,比如ab.js
  1. @(pattern|pat*|pat?erN): 匹配多个模型中的任意1个.
@(pattern|pattern|pattern): 匹配路径中的某部分: 多个模型中的1.
精确匹配模型,不可以组合.?的区别就是不可以为空.必须要是其中的一个.

glob("js/@(a|a1|b).js",function (er, files) {
    console.log(files)
})6 的区别是不匹配为空的情况
  1. ** : 和 1 一样,可以匹配任何内容,但**不仅匹配路径中的某一段,而且可以匹配 ‘a/b/c’ 这样带有’/'的内容,所以,它还可以匹配子文件夹下的文件.
**: 不是一个单独的路径中的某部分,而是可以带有'/',所以所有当前文件夹和子文件夹下都进行匹配

glob("**/@(a|a1|b).js",function (er, files) {
    console.log(files)
})

获取当前目录所有文件夹及子文件夹下的a.js,a1.js,b.js

还有一种方式是设置 matchBase 属性为 true ,同样可以起到在当前路径下搜索所有子文件夹的效果:

matchBase: 设置为true以后,在当前目录下所有的文件夹和子文件夹里寻找匹配的文件

glob("@(a|a1|b).js",{matchBase:true},function (er, files) {
    console.log(files)
})

没有获取到任何匹配文件:

当 glob 没有获取到任何匹配的文件是,并不会像 shell 里那样返回模型本身, files 参数返回的是一个空数组,如果需要让 files 返回的是模型本身,需要设置 nonull 属性为 true

nonull: 设置为true以后,如果没有找到匹配的文件,不返回空字符串,而是返回原始glob语句

glob("@(c|d|e).js",{nonull:true},function (er, files) {
    console.log(files)
})

同步获取匹配文件列表:

前面讲到的都是异步的方法,传入一个回调,当获取到匹配的文件的时候执行回调.如果需要同步的获取文件列表,可以这样做:

var files = glob.sync(pattern, [options])
Glob类:

通过实例化一个glob.Glob类,可以获得一个glob对象:

var Glob = require("glob").Glob
var mg = new Glob(pattern, options, cb)

实例化的时候传入的参数和 glob(pattern,options,cb) 是一样的.

它能够得到一个返回值,这个返回值是一个 EventEmitter.

如果在选项中设置 sync 属性为 true, 表示同步获取.不可以传入cb回调. 要获取匹配结果,可以通过 g.found 来获取:

var globInstance = new glob.Glob("@(a|a1|b).js",{nonull:true,matchBase:true,sync:true});
console.log(globInstance.found);
事件:
  • end : end事件会在文件匹配结束,找出所有匹配结果的时候触发,它接受的参数就是找到的文件的数组
  • match : match事件会在每次匹配到一个文件的时候触发,它接受的参数就是匹配到的文件
  • error : error事件会在匹配遇到错误的时候触发.接受的参数就是错误信息
  • abort : 当实例调用了.abort()方法时,abort事件被触发
方法:
  • pause 暂停匹配搜索
  • resume 继续匹配搜索
  • abort 永远停止匹配搜索,不能继续
var globInstance = new glob.Glob("js/@(a|a1|b).js",{nonull:true});
globInstance.on('match',function(file){
    console.log(file)
});
globInstance.on('end',function(files){
    console.log(files)
});
globInstance.on('abort',function(){
    console.log('abort')
});
globInstance.pause();
globInstance.resume();
globInstance.abort();
属性:
  • minimatch glob所使用的minimatch对象.
  • options 传递给函数的options选项.
  • aborted 调用过abort()函数后它的值就是true.
  • cache
  • statCache
  • symlinks
  • realpathCache
options选项:

options 用于配置模型匹配时候的匹配方式. 所有可以被传入到 minimatch 里的参数也都可以被传入到 glob ,另外 node-glob 还自己添加了一些配置项.

所有的选项如果没有特殊说明,默认值都是false

所有的选项也都适用于Glob类.

具体属性参考 GitHub 上的官方文档介绍:https://github.com/isaacs/node-glob

转自:https://www.cnblogs.com/liulangmao/p/4552339.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值