C#关于DataTable全表查询的优化

最新推荐文章于 2024-06-27 15:16:22 发布

Brilliant丶H

最新推荐文章于 2024-06-27 15:16:22 发布

阅读量1.8k

点赞数

分类专栏：工作总结

本文链接：https://blog.csdn.net/weixin_44896359/article/details/100725084

版权

工作总结专栏收录该内容

2 篇文章 0 订阅

订阅专栏

初级程序员的历程
由于公司的项目比较多，在研发人员不够的情况下，我由java开发暂时接手一个.net的winform开发，在完全没接触过.net的情况下，开始了自己的踩坑之旅。
在开发过程中印象最深的一个点是，有一个数据量为2万行的DataTable要进行数据处理，有一个字段（假设是a字段）是有许多内容相同的，对同一内容的a字段进行某些操作，所以需要在DataTable中查询a字段为某值的所有数据，在百度了DataTable的查询方法后，选择了大多人推荐的dt.select（express）来获取满足条件的所有行，之后会对这些行进行一系列的逻辑处理，也就是在select之后还有两部分的循环。
这是生成报表过程中的一部分数据处理，为了防止winform界面卡死，所以开启了线程。问题就出现在这里，在之前数据量为7000左右的情况下，跑出报表需要一分钟左右，当数据量到了2万行，跑出报表需要七分钟以上，虽然在到两万行之前在代码中加了一些逻辑判断，但我想应该对速度没什么影响吧，但是这个现象让我觉得很无法理解，所以我也以为是没有开线程（此时在我的心里认为开启线程就等于程序运行速度加快），但是查看代码后发现是开了线程的，所以耗时的地方在代码中。
之后查看文档，查到了datatable的select方法类似于全表查询获取，每次查询都要差不多遍历全表，如果第一个查询的内容在表的最后一行，那第一次就要遍历全表，所以这个时间复杂度是很大的，所以程序运行的慢的原因就是在这里，同时，类似于多个嵌套for循环的程序，也会耗时较多，最终的解决办法是将datatable转化为了dictionary<string,List>的形式，在查数据的时候使用dictionary.TryGetValue（key，out list）获取所有符合条件的数据，也就是for循环的时间复杂度降为了n，再次跑报表的时候，果然，速度相比之前可以用飞速来形容了。
作为刚毕业的新人，在程序开发道路上还有很多要理解要探索的事情，从这个问题中可以看出，我对线程的理解太浅，对程序优化也是刚刚才摸到，以后加油，也记录成长路上遇到的各种问题，努力提升自己。