Parallel.ForEach处理List导致数据丢失

是同一个dt,但执行之后的结果行数不同,代码如下:

 List<logistics_freight_bill_tbl> insertList1 = new List<logistics_freight_bill_tbl>();
            foreach (DataRow row in dt.Rows)
            {
                logistics_freight_bill_tbl info = new logistics_freight_bill_tbl();
                info.address = row["目的地"].ToString();
                insertList1.Add(info);
            }

            List<logistics_freight_bill_tbl> insertList2 = new List<logistics_freight_bill_tbl>();
            Parallel.ForEach(dt.Rows.Cast<DataRow>(), new ParallelOptions() { MaxDegreeOfParallelism = 10 }, async (row) =>
            {
                logistics_freight_bill_tbl info = new logistics_freight_bill_tbl();
                info.address = row["目的地"].ToString();
                insertList2.Add(info);
            });

insertList1 是在一个普通的 foreach 循环中被填充,而 insertList2 是在一个并行循环 Parallel.ForEach 中被填充。问题出现在对 insertList2 的操作上,因为 List<T> 类型不是线程安全的。

当你在 Parallel.ForEach 中使用 insertList2.Add(info) 时,可能会有多个线程同时尝试向 insertList2 添加元素。由于 List<T> 没有同步机制来保护其内部数据结构,在并发环境下这可能导致数据丢失或异常,从而使得 insertList2 的最终元素数量与 dt.Rows 的行数不一致。

要解决这个问题,你可以采取以下几种方法之一:

1. 使用线程安全集合

例如,ConcurrentBag<T> 是一个线程安全的集合,适用于并行操作。

ConcurrentBag<logistics_freight_bill_tbl> insertList2 = new ConcurrentBag<logistics_freight_bill_tbl>();
Parallel.ForEach(dt.Rows.Cast<DataRow>(), new ParallelOptions() { MaxDegreeOfParallelism = 10 }, (row) =>
{
    logistics_freight_bill_tbl info = new logistics_freight_bill_tbl();
    info.address = row["目的地"].ToString();
    insertList2.Add(info);
});

2. 使用锁

通过在添加元素时使用锁来确保每次只有一个线程能够修改列表。

List<logistics_freight_bill_tbl> insertList2 = new List<logistics_freight_bill_tbl>();
object lockObj = new object();
Parallel.ForEach(dt.Rows.Cast<DataRow>(), new ParallelOptions() { MaxDegreeOfParallelism = 10 }, (row) =>
{
    logistics_freight_bill_tbl info = new logistics_freight_bill_tbl();
    info.address = row["目的地"].ToString();
    lock (lockObj)
    {
        insertList2.Add(info);
    }
});

3. 收集并行结果然后合并

在并行循环中,为每个线程创建局部列表,然后在循环结束后将它们合并到主列表中。

List<logistics_freight_bill_tbl> insertList2 = new List<logistics_freight_bill_tbl>();
Parallel.ForEach(dt.Rows.Cast<DataRow>(),
    new ParallelOptions() { MaxDegreeOfParallelism = 10 },
    () => new List<logistics_freight_bill_tbl>(), // 初始化线程局部变量
    (row, state, localList) => // body
    {
        logistics_freight_bill_tbl info = new logistics_freight_bill_tbl();
        info.address = row["目的地"].ToString();
        localList.Add(info);
        return localList;
    },
    (finalResult) => // localFinally
    {
        lock (insertList2)
        {
            insertList2.AddRange(finalResult);
        }
    }
);

在这些方法中,选择哪一种取决于你的具体需求和性能考虑。如果保持顺序不是必须的,ConcurrentBag<T> 是一个简单有效的选择。如果需要保持特定的顺序,那么使用锁或者局部集合的方法可能更合适。

### 回答1: Parallel.For 和 Parallel.ForEachC# 中 System.Threading.Tasks 命名空间中的并行循环运算符。 Parallel.For 用于并行循环迭代固定数量的迭代次数。例如: ``` Parallel.For(0, 10, i => { Console.WriteLine("Iteration {0}", i); }); ``` Parallel.ForEach 用于并行循环迭代集合中的元素。例如: ``` List<string> words = new List<string> { "apple", "banana", "cherry" }; Parallel.ForEach(words, word => { Console.WriteLine("Word: {0}", word); }); ``` 这两种运算符都会在多个线程中并行运行,可以帮助提高程序的运行效率。 ### 回答2: Parallel.For和Parallel.ForEach是.NET Framework提供的用于并行处理迭代操作的两个方法。 首先,我们来看一下Parallel.For的例子。假设我们有一个包含100个数字的数组,我们想对每个数字进行平方操作,并在控制台输出。我们可以使用Parallel.For来实现并行化的迭代处理。代码如下: ``` int[] numbers = Enumerable.Range(1, 100).ToArray(); Parallel.For(0, numbers.Length, i => { numbers[i] = numbers[i] * numbers[i]; Console.WriteLine(numbers[i]); }); ``` 在这个例子中,我们使用Enumerable.Range方法创建了一个包含1到100的数组。然后,我们使用Parallel.For方法并行遍历数组中的每个元素。对于每个元素,我们将其平方,并在控制台输出结果。 接下来,我们来看一下Parallel.ForEach的例子。假设我们有一个字符串列表,我们想要并行地将每个字符串转换为大写,并将结果存储在新的列表中。我们可以使用Parallel.ForEach来实现并行化的迭代处理。代码如下: ``` List<string> strings = new List<string> { "hello", "world", "parallel", "foreach" }; List<string> upperCaseStrings = new List<string>(); Parallel.ForEach(strings, str => { upperCaseStrings.Add(str.ToUpper()); }); foreach (string str in upperCaseStrings) { Console.WriteLine(str); } ``` 在这个例子中,我们创建了一个包含几个字符串的列表。然后,我们使用Parallel.ForEach方法并行地遍历列表中的每个字符串。对于每个字符串,我们将其转换为大写,并将结果添加到一个新的列表中。最后,我们使用普通的foreach循环,在控制台输出转换为大写的字符串。 总结起来,Parallel.For和Parallel.ForEach是.NET Framework提供的用于并行处理迭代操作的两个方法。它们可以帮助我们以更高效的方式处理大规模的迭代任务,并发挥多核处理器的优势。 ### 回答3: Parallel.For 是 .NET Framework 中的一个多线程并行编程的方法,它允许我们以一种简单的方式创建一个 for 循环并在多个线程中并行执行循环中的迭代。 下面是一个使用 Parallel.For 方法的示例代码: ``` Parallel.For(0, 10, i => { Console.WriteLine("当前线程ID:{0},i的值为:{1}", Thread.CurrentThread.ManagedThreadId, i); }); ``` 上述代码会创建一个从0到9的循环,并使用多个线程并行地执行循环中的每个迭代。在控制台输出中,可以看到当前线程的ID和迭代的值。 而 Parallel.ForEach 方法也是 .NET Framework 中的一个多线程并行编程的方法,它允许我们以一种简单的方式遍历一个集合并在多个线程中并行执行每个元素的操作。 下面是一个使用 Parallel.ForEach 方法的示例代码: ``` List<int> numbers = new List<int> { 1, 2, 3, 4, 5 }; Parallel.ForEach(numbers, number => { Console.WriteLine("当前线程ID:{0},number的值为:{1}", Thread.CurrentThread.ManagedThreadId, number); }); ``` 上述代码会创建一个包含整数的 List 集合,并使用多个线程并行地执行每个元素的操作。在控制台输出中,可以看到当前线程的ID和每个元素的值。 总结来说,Parallel.For 和 Parallel.ForEach 提供了一种简单的方式在多个线程中并行执行循环或集合的操作。通过使用这些方法,我们可以更好地利用多核处理器和多线程编程,从而实现更高效的并行计算。
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值