“标准查询运算符”是组成语言集成查询 (LINQ) 模式的方法。大多数这些方法都在序列上运行,其中的序列是一个对象,其类型实现了IEnumerable<T> 接口或 IQueryable<T> 接口。标准查询运算符提供了包括筛选、投影、聚合、排序等功能在内的查询功能。
各个标准查询运算符在执行时间上有所不同,具体情况取决于它们是返回单一值还是值序列。返回单一值的方法(例如 Average 和 Sum)会立即执行。返回序列的方法会延迟查询执行,并返回一个可枚举的对象。
对于在内存中集合上运行的方法(即扩展 IEnumerable<T> 的方法),返回的可枚举对象将捕获传递到方法的参数。在枚举该对象时,将使用查询运算符的逻辑,并返回查询结果。
与之相反,扩展 IQueryable<T> 的方法不会实现任何查询行为,但会生成一个表示要执行的查询的表达式树。查询处理由源 IQueryable<T> 对象处理。
一、按标准执行方式分类
标准查询运算符方法的 LINQ to Objects 实现采用两种主要方式之一来执行:立即执行和延迟执行。采用延迟执行的查询运算符可以进一步分为两类:流式和非流式。
1.执行方式
(1)立即: 立即执行意味着在代码中声明查询的位置读取数据源并执行运算。 返回单个不可枚举的结果的所有标准查询运算符都立即执行。
(2)延迟: 延迟执行意味着不在代码中声明查询的位置执行运算。 仅当对查询变量进行枚举操作时才执行运算,例如通过使用 foreach 语句。这意味着查询的执行结果取决于执行查询而非定义查询时的数据源内容。如果多次枚举查询变量,则每次结果可能都不同。几乎所有返回类型为 IEnumerable<T> 或 IOrderedEnumerable<TElement> 的标准查询运算符都以延迟方式执行。
采用延迟执行方式的查询运算符可以另外分类为流式和非流式。
①流式运算符不需要在生成元素前读取所有源数据。在执行时,流式运算符一边读取每个源元素,一边对该源元素执行运算,并在可行时生成元素。流式运算符将持续读取源元素直到可以生成结果元素。这意味着可能要读取多个源元素才能生成一个结果元素。
②非流式运算符必须读取所有源数据才能生成结果元素。诸如排序和分组等运算属于此类别。在执行时,非流式查询运算符读取所有源数据,将其放入数据结构中,执行运算,然后生成结果元素。
二、排列数据
排序操作按一个或多个特性对序列的元素进行排序。第一个排序条件对元素执行主要排序。通过指定第二个排序条件,可以对各个主要排序组中的元素进行排序。
下图演示对一个字符序列执行按字母排序操作的结果。
方法名 | 说明 | C# 查询表达式语法 |
OrderBy | 按升序对值进行排序。 | orderby |
OrderByDescending | 按降序对值进行排序。 | orderby … descending |
ThenBy | 按升序执行次要排序。 | orderby …, … |
ThenByDescending | 按降序执行次要排序。 | orderby …, … descending |
Reverse | 颠倒集合中的元素的顺序。 | X |
下面通过演示使用 orderby 进行升序排序:按字符串长度
var words = new[] { "the", "quick", "brown", "fox", "jumps" };
var query = from word in words
orderby word.Length
select word;
foreach (var word in query)
{
Console.WriteLine(word);
}
下面通过演示使用 orderby descending 进行降序排序:按字符串的第一个字母
var words = new[] { "the", "quick", "brown", "fox", "jumps" };
var query = from word in words
orderby word.Substring(0,1) descending
select word;
foreach (var word in query)
{
Console.WriteLine(word);
}
下面通过演示使用 orderby 进行主要和次要排序:先升序按字符串长度(主)、再升序按字符串的第一个字母(次)
var words = new[] { "the", "quick", "brown", "fox", "jumps" };
var query = from word in words
orderby word.Length, word.Substring(0, 1)
select word;
foreach (var word in query)
{
Console.WriteLine(word);
}
下面通过演示使用 orderby descending 进行主要和次要排序:先升序按字符串长度(主)、再降序按字符串的第一个字母(次)
var words = new[] { "the", "quick", "brown", "fox", "jumps" };
var query = from word in words
orderby word.Length, word.Substring(0, 1) descending
select word;
foreach (var word in query)
{
Console.WriteLine(word);
}
三、Set 操作
LINQ 中的 Set 操作是指根据相同或不同集合中是否存在等效元素来生成结果集的查询操作。
方法名 | 说明 | C# 查询表达式语法 |
Distinct |
从集合移除重复值。 |
X |
Except |
返回差集,差集是指位于一个集合但不位于另一个集合的元素。 |
X |
Intersect |
返回交集,交集是指同时出现在两个集合中的元素。 |
X |
Union |
返回并集,并集是指位于两个集合中任一集合的唯一的元素。 |
X |
图解 Set 操作
(1)Distinct: 返回的序列包含输入序列的唯一元素。
(2)Except: 返回的序列只包含位于第一个输入序列但不位于第二个输入序列的元素。