Csharp--Read Csv file to DataTable

在网上找的资料都不怎么好使,许多代码一看就知道根本没有考虑全面。

最后找到一个好用的,在codeproject上,这位老兄写成了一个framework,太重了。

http://www.codeproject.com/Articles/9258/A-Fast-CSV-Reader

确实挺好用的。

我没耐下性子看他的实现,自己尝试写了如下的代码来完成了阅读csv.

参照:http://msdn.microsoft.com/en-us/library/ae5bf541%28v=vs.90%29.aspx

只写了两个方法,组织得不是特别优雅。

使用的时候只需要调用ReadCsv2DT即可,传入参数是文件路径和第一行是否是Header的布尔值。

第二个方法是替换CSVWriter封装的多余的双引号。

   

 public static DataTable ReadCsv2DT(string filename,bool isFirstLineHeader)
        {
            DataTable dt = new DataTable();
            int quotecount = 0;
            int lastbyte = 0;
            int b = 0;
            DataRow dr = null;
            bool isfirstline = true;
            int colindex = 0;
            List<string> firstlinefields = new List<string>();
            StringBuilder sb = new StringBuilder();
            using (FileStream fs = File.OpenRead(filename))
            { 
                while ((b = fs.ReadByte()) != -1)
                {
                    if (!isfirstline && dr == null)
                        dr = dt.NewRow();
                    if (b == 10 && lastbyte == 13 && quotecount % 2 == 0) //one row finished
                    {
                        if (!isfirstline)
                        {
                            dr[colindex] = removeTextQualifier(sb.ToString());
                            dt.Rows.Add(dr);
                        }
                        else
                        {
                            if (isFirstLineHeader)
                                dt.Columns.Add(removeTextQualifier(sb.ToString()));
                            else firstlinefields.Add(removeTextQualifier(sb.ToString()));
                            //build the table strucure
                            if (isfirstline && !isFirstLineHeader)
                            {
                                for (int i = 1; i <= firstlinefields.Count; i++)
                                {
                                    dt.Columns.Add("col" + i);
                                }
                                dr = dt.NewRow();
                                for (int j = 0; j < firstlinefields.Count; j++)
                                {
                                    dr[j] = firstlinefields[j];
                                }
                                dt.Rows.Add(dr);
                            }
                            isfirstline = false;
                        }
                        sb.Clear();
                        quotecount = 0;
                        b = 0;
                        dr = null;
                        colindex = 0;
                        lastbyte = 0;
                    }
                    else if (b == 44 && quotecount % 2 == 0) //one filed found 44 stand for comma
                    {
                        if (isfirstline)
                        { if (isFirstLineHeader)
                                dt.Columns.Add(removeTextQualifier(sb.ToString()));
                            else
                                firstlinefields.Add(removeTextQualifier(sb.ToString()));
                         }
                        else dr[colindex] =removeTextQualifier(sb.ToString());
                        sb.Clear();
                        colindex++;
                    }
                    else
                    {
                        if (b == 34) quotecount++; //"
                        lastbyte = b;
                        sb.Append(UnicodeEncoding.ASCII.GetString(new byte[] { byte.Parse(b.ToString()) }));
                    }
                }
            };
            return dt;
        }
 
        public static string removeTextQualifier(string text)

        {
            string pattern = "^\"(?<word>[\\s\\S]*?)\"[\r\n]*$";
            Regex rgx = new Regex(pattern,RegexOptions.Multiline);
            Match m = rgx.Match(text);
            if (m.Success)
                //return m.Result("($1)").Replace("\"\"", "\"");
                return m.Groups["word"].Value.Replace("\"\"", "\"");
            else
                return text.Replace("\"\"", "\"");
        }
 
    }

 

效果图:测试了一个文件,效果还可以,和Excel打开显示的无差异。

如果你需要测试的话,请确保自己写的文件是有效的csv文件,否则请使用excel另存为,自己写的文件改后缀不是真正的csv.

转载于:https://www.cnblogs.com/huaxiaoyao/p/4143939.html

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值