关于使用cspreadsheet读写EXCEL表格数据的问题

    前几天项目有读写EXCEL表格的需求,我就找了大概有几种,大致分为:COM方法、ODBC方法、OLE方法、纯底层格式分析方法。由于COM方法要求必须安装有OFFICE的EXCEL组件,纯底层格式分析方法又很多功能需要自行去完善,所有最终选择了数据库的方法,用数据库的方法去存取xls格式的数据。网上有一个高手写的CSpreedSheet,看了一下提供的接口,感觉挺好用的。在使用的过程中发现几个问题,做如下探讨:

    1 cspreadsheet的构造问题:

    CSpreadSheet(CString File, CString SheetOrSeparator, bool Backup = true);

    第一个参数不用多说,是xls文件的全路径;

    第二个参数也不用多说,是xls其中某一个表格的名字,不过有趣的是,如果你不确定表格的名称,可以用空字符串代替,它便会默认读取第一个表格;

    第三个参数默认为true,我觉得这个参数是很有问题的。这个参数为true的原始意义是读取表格时额外做个备份,但是如果你的xls表格不是每列每行都全有数据的时候,它便会严重破坏你的表格数据,这可能是作者的无心之失,实验的数据可能全是满值的结果吧。这个问题想改也很容易,就是删除表格重新写入的过程。所以我构造这个对象的时候最后一个参数为false,我不需要有备份,这样便会省去删除表格又重新写的麻烦了。

    2 AddCell问题,四参数的那个:

    bool AddCell(CString CellValue, CString column, long row = 0, bool Auto = true);

    如果你想添加一个新列,就必须得到你想添加在哪一列,分析当最后一个参数添加新列的方式:

    (1)当最后一个参数为true时具体代号在EXCEL中可以看出,第一列是“A”,第二列为“B”,以此类推,传入的第二个参数必须是“A”、“B”...如果你想在没有数据的下一列生成新列,方法就是先用GetTotalColumns()获得总的列数,然后“A”代表65,新的一列的值为 65 + 总列数 - 1,再转换成ASCII字符传进去就OK了。

    (2)当最后一个参数为false时,第二个参数就只能传入列头了,比如xls表其中一个列头名为Age,则传入第二个参数就传入“Age”,只能代替原有表格的数据,但是当你想添加新列,列头名为Tel的时候,就不能做了,原因是作者没有考虑到最后一个参数为false的时候,添加新列的情况。

    这个问题也很简单,我做了如下修改,便可以用AddCell("Tel","Tel",0,false)用新表头来创建新列了,

bool CSpreadSheet::AddCell(CString CellValue, CString column, long row, bool Auto)
{
 short columnIndex = CalculateColumnNumber(column, Auto);
 if (columnIndex == 0)
 {

    columnIndex = m_aFieldNames.GetSize()+1;
 }

 if (AddCell(CellValue, columnIndex, row))
 {
  return true;
 }
 return false;
}

    这样修改的目的就是当在原有的列头中搜索,没有发现就认定为新的列,返回一个列的列号。

    3 第三个问题相信有很多朋友都遇到过,就是用cspreadsheet生成的表格,每个格子里的数据左上方会有一个上逗号的标志:“’” 虽然不影响读取数据,但影响了美观。

    起初我怀疑是写入表格的时候所有数据前有个多余的“’”符号,但我跟踪代码后并没有发现,后来找了个新的读写EXCEL的开源库 ExcelFormat_src,发现写入的也是有“’”符号,这两种都是用的数据库方式。所以,我断定这个数据库方式特点,“’”符号代表是字符串类型的。

    出现这个情况的原因就是CSpreadSheet将所有的数据类型都按一种称为万能类型的字符串类型,这种处理方式虽然简单,但是却忽略了每一列的数据类型,在数据库中每一列代表每一个字段。

    于是我将CSpreadSheet源代码修改了一下,用来区别开字符串类型和数字类型,加入了PUBLIC成员变量vector<BOOL> vecNumOrAlp;

    它的含义就是为了表征每一列的数据类型,FALSE时为字符串类型,TRUE为数值类型。

    然后修改AddRow函数的代码:

    将m_stempSql.Format("\"%s\"%s", RowValues.GetAt(i), m_sSeparator);替换为:

    if(!vecNumOrAlp[i])

        m_stempSql.Format("\"%s\"%s", RowValues.GetAt(i), m_sSeparator);

    else

    {

        float f = atof((LPCSTR)RowValues.GetAt(i));

        m_stempSql.Format("\"%.7f\"%s", f, m_sSeparator);

    }

    修改Commit()代码如下:

    将m_stempSql = m_stempSql + "[" + m_aFieldNames.GetAt(j) +"]" + " char(255), ";替换为:

   

    if(!vecNumOrAlp[i])

        m_stempSql = m_stempSql + "[" + m_aFieldNames.GetAt(j) +"]" + " text, ";

    else

         m_stempSql = m_stempSql + "[" + m_aFieldNames.GetAt(j) +"]" + " double, ";   

 

    经过如此修改,就可以区分出数值类型和字符串类型的,而且数字类型的左上角不会有”‘“符号了。当然,如果牵扯到其他类型,比如日期型,可以将vecNumOrAlp的BOOL类型改成结构体或枚举类型的,用来表征不同的数据类型。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值