C#并发实战Parallel.ForEach使用与测评

转自:<渔人>

cnblogs.com/heweijian/p/11330282.html

前言

最近给客户开发一个伙食费计算系统,大概需要计算2000个人的伙食。需求是按照员工的预定报餐计划对消费记录进行检查,如有未报餐有刷卡或者有报餐没刷卡的要进行一定的金额扣减等一系列规则。

一开始我的想法比较简单,直接用一个for循环搞定,统计结果倒是没问题,但是计算出来太慢了需要7,8分钟。这样系统服务是报超时错误的,让人觉得有点不太爽。由于时间也不多就就先提交给用户使用了,后面逻辑又增加了,计算时间变长,整个计算一遍居然要将近10分钟了。

这个对用户来说是能接收的(原来自己手算需要好几天呢),但是我自己接受不了,于是就开始优化了,怎么优化呢,用多线程呗。

一提到多线程,最先想到的是Task了,毕竟.net4.0以上Task封装了很多好用的方法。但是Task毕竟是多开一些线程去执行任务,最后整合结果,这样可以快一些,但我想更加快速一些,于是想到了另外一个对象:Parallel。

之前在维护代码是确实有遇到过别人写的Parallel.Invoke,只是指定这个函数的作用是并发执行多项任务,如果遇到多个耗时的操作,他们之间又不贡献变量这个方法不错。

我的情况是要并发执行一个集合,于是就用了List.ForAll 这个方法其实是拓展方法,完整的调用为:List.AsParallel().ForAll,需要先转换成支持并发的集合,等同于Parallel.ForEach,目的是对集合里面的元素并发执行一系列操作。

于是乎,把原来的foreach换成了List.AsParallel().ForAll,运行起来,果然速度惊人,不到两分钟就插入结果了,但最后却是报主键重复的错误,这个错误的原因是,由于使用了并发,这个时候变量自增,其实是在强着自增,当多个线程同时获取到了id值,都去自增然后就重复了,举个例子如下:

int num = 1;
List<int> list = new List<int>();
for (int i = 1; i <= 2000; i++)
{
    list.Add(i);
}
Console.WriteLine($"num初始值为:" + num.ToString());
list.AsParallel().ForAll(n =>
{
    num++;
});
Console.WriteLine($"不加锁,并发{list.Count}次后为:" + num.ToString());
Console.ReadKey();

这段代码是让一个变量执行2000次自增,正常结果应该是2001,但实际结果如下:

17d9939b4dd130d28fee6e8a25b5267f.png

有经验的同学,立马能想到需要加锁了,C#内置了很多锁对象,如lock 互斥锁,Interlocked 内部锁,Monitor 这几个比较常见,lock内部实现其实就是使用了Monitor对象。

对变量自增,Interlocked对象提供了,变量自增,自减、或者相加等方法,我们使用自增方法Interlocked.Increment,函数定义为:int Increment(ref int num),该对象提供原子性的变量自增操作,传入目标数值,返回或者ref num都是自增后的结果。在之前的基础上我们增加一些代码:

num = 1;
Console.WriteLine($"num初始值为:" + num.ToString());
list.AsParallel().ForAll(n =>
{
   Interlocked.Increment(ref num);
});
Console.WriteLine($"使用内部锁,并发{list.Count}次后为:" + num.ToString());
Console.ReadKey();

我们来看运行结果:

40a9f75562bb6c4b0bfd35c70aac01e6.png

加了锁之后ID重复算是解决了,其实别高兴太早,由于正常的环境有了ID我们还有用这些ID来构建对象呢,于是又写了写代码,用集合来添加这些ID,为了更真实的模拟生产环境,我在forAll里面又加了一层循环代码如下:

num = 1;
Random random = new Random();
var total = 0;
var m = new ConcurrentBag<int>();
list.AsParallel().ForAll(n =>
{
    var c = random.Next(1, 50);
    Interlocked.Add(ref total, c);
    for (int i = 0; i < c; i++)
    {
        Interlocked.Increment(ref num);
        m.Add(num);
    }
});
Console.WriteLine($"使用内部锁,并发+内部循环{list.Count}次后为:" + num.ToString());
Console.WriteLine($"实际值为:{total + 1}");
var l = m.GroupBy(n => n).Where(o => o.Count() > 1);
Console.WriteLine($"并发里面使用安全集合ConcurrentBag添加num,集合重复值:{l.Count()}个");
Console.ReadKey();

a0440e68910eab9188b2711af4a85b04.png

上面的代码里面我用到了线程安全集合ConcurrentBag<T>它的命名空间是:using System.Collections.Concurrent,尽管使用了线程安全集合,但是在并发面前仍然是不安全的,到了这里其实比较郁闷了,自增加锁,安全集合内部应该也使用了锁,但还是重复了。

有点说不过去了,想想多线程执行时有个上下文对象,即当多个线程同时执行任务,共享了变量他们一开始传进去的对象数值应该是相同的,由于变量自增时加了锁,所以ID是不会重复了。

我猜测问题应该出在Add方法了,就是说当num值自增后还没有来得及传出去就已经执行了Add方法,故添加了重复变量。于是乎,我重新写了段代码,让ID自增和集合添加都放到锁里面:

num = 1;
total = 0;
using (var q = new BlockingCollection<int>())
{
    list.AsParallel().ForAll(n =>
    {
        var c = random.Next(1, 50);
        Interlocked.Add(ref total, c);
        for (int i = 0; i < c; i++)
        {
           // Task.Delay(100);
           q.Add(Interlocked.Increment(ref num));
           //可控
          //lock (objLock)
            //{
            //    num++;
            //    q.Add(num);
            //}
        }
    });
    q.CompleteAdding();
    Console.WriteLine($"num累计值为:{total},并发之后值为:{num}");
    var x = q.GroupBy(n => n).Where(o => o.Count() > 1);
    Console.WriteLine($"并发使用安全集合BlockingCollection+Interlocked添加num,集合重复值:{x.Count()}个");
    Console.ReadKey();
}

这里我测试了另外一个线程安全的集合BlockingCollection,关于这个集合的使用请自行查找MSDN文档,上面的关键代码直接添加安全集合的返回值,可以保证集合不会重复,但其实下面的lock更适用与正式环境,因为我们添加的一般都是对象不会是基础类型数值,运行结果如下:

0a44e0a909a27e703b2f8e0a213403bb.png

至此,我们的问题解决了,计算时间由原来的9分多降至110秒左右,可见Parallel的处理还是很给力的,唯一不足的是,很占CPU,执行计算后CPU达到了88%。附上计算结果:

876a3fd2b0f0a8ec381d54f713326a2e.png

优化前后对比

435096d20a0f549720dd350aba2f2d8f.png

总结

C#安全集合在并发的情况下其实不一定是安全的,还是需要结合实际应用场景和验证结果为准。

Parallel.ForEach在对循环数量可观的情况下是可以去使用的,如果有共享变量,一定要配合锁做同步处理。

还是得慎用这个方法,如果方法内部有操作数据库的记得增加事务处理,否则就呵呵了。

版权声明:本文来源于网友收集或网友供稿,仅供学习交流之用,如果有侵权,请转告小编或者留言,本公众号立即删除。

- EOF -

技术群:添加小编微信dotnet999

公众号:dotnet讲堂

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: Parallel.For 和 Parallel.ForEachC# 中 System.Threading.Tasks 命名空间中的并行循环运算符。 Parallel.For 用于并行循环迭代固定数量的迭代次数。例如: ``` Parallel.For(0, 10, i => { Console.WriteLine("Iteration {0}", i); }); ``` Parallel.ForEach 用于并行循环迭代集合中的元素。例如: ``` List<string> words = new List<string> { "apple", "banana", "cherry" }; Parallel.ForEach(words, word => { Console.WriteLine("Word: {0}", word); }); ``` 这两种运算符都会在多个线程中并行运行,可以帮助提高程序的运行效率。 ### 回答2: Parallel.For和Parallel.ForEach是.NET Framework提供的用于并行处理迭代操作的两个方法。 首先,我们来看一下Parallel.For的例子。假设我们有一个包含100个数字的数组,我们想对每个数字进行平方操作,并在控制台输出。我们可以使用Parallel.For来实现并行化的迭代处理。代码如下: ``` int[] numbers = Enumerable.Range(1, 100).ToArray(); Parallel.For(0, numbers.Length, i => { numbers[i] = numbers[i] * numbers[i]; Console.WriteLine(numbers[i]); }); ``` 在这个例子中,我们使用Enumerable.Range方法创建了一个包含1到100的数组。然后,我们使用Parallel.For方法并行遍历数组中的每个元素。对于每个元素,我们将其平方,并在控制台输出结果。 接下来,我们来看一下Parallel.ForEach的例子。假设我们有一个字符串列表,我们想要并行地将每个字符串转换为大写,并将结果存储在新的列表中。我们可以使用Parallel.ForEach来实现并行化的迭代处理。代码如下: ``` List<string> strings = new List<string> { "hello", "world", "parallel", "foreach" }; List<string> upperCaseStrings = new List<string>(); Parallel.ForEach(strings, str => { upperCaseStrings.Add(str.ToUpper()); }); foreach (string str in upperCaseStrings) { Console.WriteLine(str); } ``` 在这个例子中,我们创建了一个包含几个字符串的列表。然后,我们使用Parallel.ForEach方法并行地遍历列表中的每个字符串。对于每个字符串,我们将其转换为大写,并将结果添加到一个新的列表中。最后,我们使用普通的foreach循环,在控制台输出转换为大写的字符串。 总结起来,Parallel.For和Parallel.ForEach是.NET Framework提供的用于并行处理迭代操作的两个方法。它们可以帮助我们以更高效的方式处理大规模的迭代任务,并发挥多核处理器的优势。 ### 回答3: Parallel.For 是 .NET Framework 中的一个多线程并行编程的方法,它允许我们以一种简单的方式创建一个 for 循环并在多个线程中并行执行循环中的迭代。 下面是一个使用 Parallel.For 方法的示例代码: ``` Parallel.For(0, 10, i => { Console.WriteLine("当前线程ID:{0},i的值为:{1}", Thread.CurrentThread.ManagedThreadId, i); }); ``` 上述代码会创建一个从0到9的循环,并使用多个线程并行地执行循环中的每个迭代。在控制台输出中,可以看到当前线程的ID和迭代的值。 而 Parallel.ForEach 方法也是 .NET Framework 中的一个多线程并行编程的方法,它允许我们以一种简单的方式遍历一个集合并在多个线程中并行执行每个元素的操作。 下面是一个使用 Parallel.ForEach 方法的示例代码: ``` List<int> numbers = new List<int> { 1, 2, 3, 4, 5 }; Parallel.ForEach(numbers, number => { Console.WriteLine("当前线程ID:{0},number的值为:{1}", Thread.CurrentThread.ManagedThreadId, number); }); ``` 上述代码会创建一个包含整数的 List 集合,并使用多个线程并行地执行每个元素的操作。在控制台输出中,可以看到当前线程的ID和每个元素的值。 总结来说,Parallel.For 和 Parallel.ForEach 提供了一种简单的方式在多个线程中并行执行循环或集合的操作。通过使用这些方法,我们可以更好地利用多核处理器和多线程编程,从而实现更高效的并行计算。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值