C# Excel检验数据是否重复及Table检验数据是否重复

最近在做导入Excel数据的时候,要检验数据是否重复:

1、要检验Excel数据本身是否有重复?

2、Excel中的数据是否与数据库中的数据重复?

一、检验Excel中数据是否重复的方式有:

1、将Table中的数据使用select语句来过滤(此处略,可以参考二)。

2、使用for循环来手动核对,代码如下:

#region  记录Excel中的重复列  
  /// <summary>  
  /// 记录Excel中的重复列  
  /// </summary>  
  /// <param name="dt">需要获取重复列的表</param>  
  /// URL:http://www.bianceng.cn/Programming/csharp/201410/45747.htm
  /// <returns>提示重复信息</returns>  
  private string GetDistinctTable(DataTable dt)  
  {  
//DataTable dtClone = dt;这种方式是错误的,因为这种情况,修改dtClone的同时dt也会被修改。  
      DataTable dtClone = dt.Clone(); ;  
      string vsSubAcctNo = string.Empty;  
      string vsAcctNo = string.Empty;  
      string repeatExcel = string.Empty;  
      string vsTransDate = string.Empty;  
      for (int i = dtClone.Rows.Count - 1; i >= 0; i--)  
      {  
          vsSubAcctNo = dtClone.Rows[i][4].ToString().Trim();  
          vsAcctNo = dtClone.Rows[i][1].ToString().Trim();  
          vsTransDate = dtClone.Rows[i][8].ToString().Trim();  
          dtClone.Rows[i].Delete();  
          dtClone.AcceptChanges();  
          for (int j = dtClone.Rows.Count - 1; j >= 0; j--)  
          {  
              if (vsSubAcctNo == dtClone.Rows[j][4].ToString().Trim() && vsAcctNo == dtClone.Rows[j][1].ToString().Trim() && vsTransDate == dtClone.Rows[j][8].ToString().Trim())  
              {  
                  //如果重复了,进行记录  
                  repeatExcel += "第" + (i + 1).ToString() + "行\r\n";  
                  break;  
              }  
          }  
      }  
      return repeatExcel;  
  }  
  #endregion

二、检验Excel中数据是否与数据库中数据重复的方式有:

1、遍历Table并将其中每条数据,在数据库中检验重复。

这种方式适用于Table中数据比较少(100以内),而数据库中要对比表很大的情况。因为这种方式要每对比一条数据,都要连接数据库,并执行查询,很费时间。

大体测试了一下,Excel中有2000条数据,仅仅在数据库中查询,就消耗了7分40秒即4601000 毫秒(ms),大约一条数据耗时:2300.5毫秒

其实,使用方式2导入2000条,耗时也比方式1导入100条,耗时少。

2、将数据库中要对比的表数据取到一个dataset中,遍历Table并将其中每条数据,在dataset中检验重复,代码如下:

strTemp = "AcctNo='" + obZH.ToString() + "' and TransDate='" + obRQ.ToString() + "'  and SubAcctNo='" + obDFZH.ToString() + "'";  
          rowsTemp = dsTemp.Tables[0].Select(strTemp);  
          if (rowsTemp.Length>0)  
          {  
              //如果重复了,进行记录  
              repeatDj += "第" + v.ToString() + "行\r\n";  
          }


from:  http://www.bianceng.cn/Programming/csharp/201410/45747.htm


  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
判断JSON数据是否重复,可以按照以下步骤进行: 1. 读取JSON文件,并将JSON数据解析为一个对象数组。 2. 对于每个JSON对象,将其转换为字符串,并计算其哈希值(可以使用C#的SHA256Managed类),将哈希值存储到一个HashSet中。 3. 如果HashSet中已经存在该哈希值,则说明该JSON数据重复的。 示例代码: ```csharp using Newtonsoft.Json; using System.Collections.Generic; using System.IO; using System.Security.Cryptography; using System.Text; public static bool HasDuplicateJson(string filePath) { HashSet<string> hashSet = new HashSet<string>(); using (StreamReader reader = new StreamReader(filePath)) { while (!reader.EndOfStream) { string line = reader.ReadLine(); object jsonObject = JsonConvert.DeserializeObject(line); string jsonString = JsonConvert.SerializeObject(jsonObject, Formatting.None, new JsonSerializerSettings { NullValueHandling = NullValueHandling.Ignore }); byte[] jsonData = Encoding.UTF8.GetBytes(jsonString); byte[] hashData = new SHA256Managed().ComputeHash(jsonData); string hashString = Encoding.UTF8.GetString(hashData); if (hashSet.Contains(hashString)) { return true; } hashSet.Add(hashString); } } return false; } ``` 该函数接受一个文件路径作为输入,返回一个布尔值,示文件中是否存在重复的JSON数据。函数内部遍历文件中的每一行JSON数据,并计算其哈希值,判断是否存在重复。函数可以根据实际情况进行修改。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值