把 Excel 文件导入关系数据库是数据分析业务中经常要做的事情,但许多 Excel 文件的格式并不规整,需要事先将其中的数据结构化后再用 SQL 语句写入数据库。而一般情况下,结构化的工作量会比较大,而且很难通用,每次都要针对文件格式进行分析后再进行开发。下面使用另外一种方式处理
1. 普通行式
先看最简单的情况:如下图所示,Excel文件中第一行是列标题,从第二行开始,每行是一条数据记录。
集算器处理这种文件也非常简单:
A | |
1 | =file( "学生成绩表.xlsx" ).xlsimport@t() |
2 | =connect("demo") |
3 | =A2.update(A1,xscj) |
A1 打开“学生成绩表.xlsx”文件并导入成序表,选项@t表示文件第一行是列标题
A2 连接demo数据库
A3 将A1中的序表存入到demo数据库的xscj表中,由于表中的列名和序表中的字段名一样,所以只需指定数据表名即可。update函数的更详细用法请查阅函数文档。
A1中得到的序表如下图所示:
A2、A3两步连接数据库和将序表存入数据库的方法是通用的,所以后面的例子中将不再写这两步,只关注于如何把Excel中的数据结构化成序表。
阅读原文可看多行表头行式,自由格式,交叉表的处理方式 :http://c.raqsoft.com.cn/article/1541129604470?r=alice