For循环中并发的思路(async/await、Task)

问题

最开始的问题,是我需要对一组的网页链接进行下载,一开始单线程的时候,就是一个网页下载,保存,结束,然后下载第二个网页。
结果当然是没有问题的,可是这效率也太低了啊,那就想了几个问题:

1、能不能同时下载多个网页?

这个是多线程问题,我一开始使用的是async/await
看代码:

private async void DownloadText(BookModel book)
        {
            var directories = directory.GetList<Model.DirectoryModel>(d => d.BookId == book.Id && d.State == true);
            foreach (var directory in directories)
            {
                await Task.Run(()=> { DownloadText(directory, book); });
            }
        }

下载方法是async 方法,说明内部有异步的代码。
await 是异步的位置,for中,异步执行这一个方法,循环注册执行之后,for循环就结束了。
这里就有一个问题。。。我for循环是结束了,可是我下载还没有结束啊,都在异步中呢,能不能在for结束的后面,让它等待一下,等所有代码结束?
async/await我没有找到解决的办法,换一个写法。

2、等待所有异步方法结束

private void DownloadText(BookModel book)
        {
            var directories = directory.GetList<Model.DirectoryModel>(d => d.BookId == book.Id && d.State == true);
            Task<bool>[] tasks = new Task<bool>[directories.Count];
            for(int i = 0; i < directories.Count; i++)
            {
                //这一步是必须的,不能将directories[i]直接放到Task中做DownloadText的参数,否者i会每次循环后发生变化,传到DownloadText里面就不是你想要传的那个对象了。
                var dir = directories[i];
                tasks[i] = Task<bool>.Factory.StartNew(() => { return DownloadText(dir, book); });
                //这种写法是不可行的,i会被外部变化,directories[i]传入的不一定是你预期的那个参数
                //tasks[i] = Task<bool>.Factory.StartNew(() => { return DownloadText(directories[i], book); });
            }
            Task.WaitAll(tasks);
        }

WaitAll会等待所有异步结束,这样,就可以等待你for循环中,所有的异步都结束之后,才会进行下一步操作。

3、控制Task的并发数量

2的内容中,Task是没有数量控制的,如果For循环中有1000个下载链接,然后瞬间Task执行1000个,然后等待。。。想想那个后果。
嗯,事实上,我这边是已经遇到了这个情况,最多的时候500+,程序会直接卡滞数秒。
而效率方面,单线程下载一秒钟2-3个网页,并发之后是5-6个网页,我不知道为什么效率就提高了这么点,而程序卡滞的却很严重。
想想解决的办法?可以限制并发的数量么?很显然,我找到了办法:
https://blog.csdn.net/starfd/article/details/79711915
控制并发执行的Task数量
需要在NuGet中下载一个MSFT.ParallelExtensionsExtras,直接NuGet中搜索就可以了。
然后定义一个并发数MaxTask,传到Task.Factory.StartNew()里面去。

private void DownloadText(BookModel book)
        {
            DownLoadTextChanging?.Invoke(book, null);
            var directories = directory.GetList<Model.DirectoryModel>(d => d.BookId == book.Id && d.State == true && d.Len == null);
            var scheduler = new LimitedConcurrencyLevelTaskScheduler(2);
            //记录一下,单线程下载,一秒钟下载2-3章。
            //异步下载一秒钟5-6章,而且程序很容易卡滞。
            Task<bool>[] tasks = new Task<bool>[directories.Count];
            for(int i = 0; i < directories.Count; i++)
            {
                //这一步是必须的,不能将directories[i]直接放到Task中做DownloadText的参数,否者i会每次循环后发生变化,传到DownloadText里面就不是你想要传的那个对象了。
                var dir = directories[i];
                tasks[i] = Task<bool>.Factory.StartNew(() => { return DownloadText(dir, book); }, CancellationToken.None, TaskCreationOptions.None, scheduler);
            }
            Task.WaitAll(tasks);
            DownLoadTextChanged?.Invoke(book, null);
        }

都不需要太多,我异步的数量写了2,就同样一秒钟可以下载5-6章,和刚才没有限制的并发是一样的,或许Task其内部有默认的数量限制?
这个暂且不知,但我限制了数量之后,效率没有降低,程序却已经不会卡了。

4、for循环中执行固定数量的并行

先说明,这个我还没有测试,我在论坛里询问,刚刚看到这个回复,先写上来,我回头试一下。

Parallel.ForEach(list, new ParallelOptions() {MaxDegreeOfParallelism=20 }, x => Console.WriteLine(x.Name));

new ParallelOptions() {MaxDegreeOfParallelism=20 } 代表线程数量,看字面意思,应该是可以指定For中的并发数,这个回头试试。

阅读终点,创作起航,您可以撰写心得或摘录文章要点写篇博文。去创作
  • 0
    点赞
  • 16
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 2
    评论
内容简介 您想淋漓尽致地发挥多核计算机系统的处理能力吗?《C#并行编程高级教程:精通NET 4 Parallel Extensions》将帮助您实现这一夙愿。这本精品书籍浓墨重彩地描述如何使用C# 4、Visual Studio 2010和.NET Framework 4高效地创建基于任务的并行应用程序,详细讲述最新的单指令、多数据流指令和向量化等并行编程技术,介绍现代并行库,讨论如何珠联璧合地使用高级Intel工具与C#,并指导您巧妙使用新引入的轻型协调结构来开发自己的解决方案并解决最棘手的并发编程问题。 主要内容 ◆介绍如何基于新Task Parallel Library和.NET 4设计稳定的可扩展并行应用程序。 ◆讲解命令式数据并行、命令式任务并行、并发集合以及协调数据结构。 ◆描述PLINQ高级声明式数据并行。 ◆讨论如何使用新的Visual Studio 2010并行调试功能来调试匿名方法、任务和线程。 ◆演示如何对数据源进行分区,以便在不同任务和线程之间合理分配工作负荷。 作者简介 Caston C.Hillar是一位独立软件咨询师,自1997年起便一直从事并行编程、多处理器和多核领域的研究,Gaston拥有使用C#和.NET Framework来设计和开发各种复杂并行解决方案的丰富经验,曾于2009年荣膺Intel Black Belt Software Developer奖。 目录 第1章 基于任务的程序设计 1.1 使用共享内存的多核系统 1.1.1 共享内存多核系统与分布式内存系统之间的区别 1.1.2 并行程序设计和多核程序设计 1.2 理解硬件线程和软件线程 1.3 理解Amdahl法则 1.4 考虑Gustafson法则 1.5 使用轻量级并发模型 1.6 创建成功的基于任务的设计 1.6.1 以并发的思想指导设计 1.6.2 理解交错并发并发和并行之间的区别 1.6.3 并行化任务 1.6.4 尽量减少临界区 1.6.5 理解多核并行程序的设计原则 1.7 为NUMA架构和更高的可扩展性做好准备 1.8 判断是否适合并行化 1.9 小结 第2章 命令式数据并行 2.1 加载并行任务 2.1.1 System.Threading.Tasks.Parallel类 2.1.2 Parallel.Invoke 2.2 将串行代码转换为并行代码 2.2.1 检测可并行化的热点 2.2.2 测量并行执行的加速效果 2.2.3 理解并发执行 2.3 循环并行化 2.3.1 Parallel.For 2.3.2 Parallel.ForEach 2.3.3 从并行循环退出 2.4 指定并行度 2.4.1 ParallelOptions 2.4.2 计算硬件线程 2.4.3 逻辑内核并不是物理内核 2.5 通过甘特图检测临界区 2.6 小结 第3章 命令式任务并行 3.1 创建和管理任务 3.1.1 System.Threading.Tasks.Task 3.1.2 理解Task状态和生命周期 3.1.3 通过使用任务来对代码进行并行化 3.1.4 等待任务完成 3.1.5 忘记复杂的线程 3.1.6 通过取消标记取消任务 3.1.7 从任务返回值 3.1.8 TaskCreationOptions 3.1.9 通过延续串联多个任务 3.1.10 编写适应并发和并行的代码 3.2 小结 第4章 并发集合 4.1 理解并发集合提供的功能 4.1.1 System.Collections.Concurrent 4.1.2 ConcurrentQueue 4.1.3 理解并行的生产者-消费者模式 4.1.4 ConcurrentStack 4.1.5 将使用数组和不安全集合的代码转换为使用并发集合的代码 4.1.6 ConcurrentBag 4.1.7 IProducerConsumerCollection 4.1.8 BlockingCollection 4.1.9 ConcurrentDictionary 4.2 小结 第5章 协调数据结构 5.1 通过汽车和车道理解并发难题 5.1.1 非预期的副作用 5.1.2 竞争条件 5.1.3 死锁 5.1.4 使用原子操作的无锁算法 5.1.5 使用本地存储的无锁算法 5.2 理解新的同步机制 5.3 使用同步原语 5.3.1 通过屏障同步并发任务 5.3.2 屏障和ContinueWhenAll 5.3.3 在所有的参与者任务捕捉异常 5.3.4 使用超时 5.3.5 使用动态数目的参与者 5.4 使用互斥锁 5.4.1 使用Monitor 5.4.2 使用锁超时 5.4.3 将代码重构为避免使用锁 5.5 将自旋锁用作互斥锁原语 5.5.1 使用超时 5.5.2 使用基于自旋的等待 5.5.3 自旋和处理器出让 5.5.4 使用volatile修饰符 5.6 使用轻量级的手动重置事件 5.6.1 使用ManualResetEventSlim进行自旋和等待 5.6.2 使用超时和取消 5.6.3 使用ManualResetEvent 5.7 限制资源的并发访问 5.7.1 使用SemaphoreSlim 5.7.2 使用超时和取消 5.7.3 使用 Semaphore 5.8 通过CountdownEvent简化动态fork和join场景 5.9 使用原子操作 5.10 小结 第6章 PLINQ:声明式数据并行 6.1 从LINQ转换到PLINQ 6.1.1 ParallelEnumerable及其AsParallel方法 6.1.2 AsOrdered和orderby子句 6.2 指定执行模式 6.3 理解PLINQ的数据分区 6.4 通过PLINQ执行归约操作 6.5 创建自定义的PLINQ聚合函数 6.6 并发PLINQ任务 6.7 取消PLINQ 6.8 指定所需的并行度 6.8.1 WithDegreeOfParallelism 6.8.2 测量可扩展性 6.9 使用ForAll 6.9.1 foreach和ForAll的区别 6.9.2 测量可扩展性 6.10 通过WithMergeOptions配置返回结果的方式 6.11 处理PLINQ抛出的异常 6.12 使用PLINQ执行MapReduce算法 6.13 使用PLINQ设计串行多步操作 6.14 小结 第7章 Visual Studio 2010的任务调试能力 7.1 充分利用多显示器的支持 7.2 理解并行任务调试器窗口 7.3 查看Parallel Stacks图 …… 第8章 线程池 第9章 异步编程模型 第10章 并行测试和调优 第11章 向量化、SIMD指令以及其他并行库 附录A .NET 4与并行相关的类图 附录B 并发UML模型 附录C Parallel Extensions Extras

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

张天星

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值