导入
如果想要使用Excel文件中的数据作为数据库中的数据表,有两种导入方法:
1. 导入数据
详情参照:将excel数据导入到SQL server数据库的详细过程
- 优点:可以使用Excel的.xlsx格式
- 缺点1:只能使用 Excel 97-2003 低版本的工作簿,不然会报错
- 解决方法:将新版本的 Excel 文件以旧版本的格式来另存
- 缺点2:Excel 97-2003 版本的工作簿最多只支持 256列 * 65536行 的工作表中的单元格
- 解决方法:对于数据量大的表进行分表处理
由于旧版本Excel工作簿对于行列数有限制,若要使用一些数据量较大的表,操作就十分繁琐。基于这个问题,本文将着重介绍另一种通用性更强的方法,就是将数据以平面文件来导入。
2. 导入平面文件(推荐)
简单来讲,平面文件(Flat-File Database)是一种简单而有效的数据库类型,它基于文本文件,将数据存储在单个文件中,而不是使用复杂的数据库系统。平面文件数据库通常用于小规模应用程序,例如桌面软件或个人网站,因为它们易于创建和维护,而且不需要高级编程技能。
在作为数据源导入进数据库的平面文件,我们以 CSV(逗号分隔值文件)为例
2.1 操作步骤
- 我们先将已有的 .xlsx 文件另存为 CSV UTF-8(逗号分隔)的文件类型
- Tip:如果表中的数据字段存在中文,单单使用CSV(逗号分隔)的文件类型来保存会出现乱码。
- 为了保证数据的完整性,请务必使用 CSV **UTF-8**(逗号分隔)来保存!
- 进入Microsoft SQL Server Management Studio,右键点击已经建立好的数据库 -> 任务 -> 导入平面文件,进入文件导入向导
- 点击预览选择要导入文件的位置,新表名称默认填充为文件名,点击“下一步”
- 在此界面可预览部分数据,确认无乱码后,点击“下一步”
- 此界面显示了表架构,DBMS对于导入文件各列的数据类型进行了自动分类,在此界面可以对主键和是否允许该列出现NULL值进行自定义,完成修改之后,点击“下一步”
- Tip:自动识别的数据类型不一定准确,有些列中的部分数据会与识别出的数据类型不符,需要手动修改
- 这个界面显示的是导入信息的摘要,点击“完成”
- 若自定义的数据类型与 CSV 文件中数据的类型相契合,则插入数据的操作完成。刷新数据库之后,就能看到导入的新表了
2.2 插入数据时的常见问题
问题一:列“column”不允许 DBNull.Value
即使在某一列中没有空值,报错信息仍会提示不允许“DBNull.Value”,什么意思呢?
其实在大多数情况下,出现这个报错信息,是因为在第五步自定义列的数据类型时出现了疏忽
例如:表中成绩列“score”大部分数据是整数,但是有个别数据含有小数,如下图所示:
由于DBMS在自动识别数据类型的时候是根据该列主要的数据类型来识别的,所以把 “score” 这一列的数据类型定义成了 “tinyint”
将其更改为“float”之后,就不会出错了
问题二:科学计数法的显示
在实际的数据存储中,难免会有大数字字段,如下图所示:
由于 Excel 单元格的默认格式是“常规”,在将 XLSX 文件另存为 CSV 文件之后,大数会以科学计数法的形式呈现,并失去一定的精度,导致数据的丢失:
.xlsx文件
.csv文件
解决方案:
首先,在生成.csv的.xlsx源文件中,将含有大数字的列的格式修改成:其他数字格式 - 数字 - 自定义
将修改完格式后的.xlsx文件另存为.csv文件打开后,会发现单元格内的大数仍以科学计数法显示;但是可以发现,文本编辑器(以文本编辑器中显示的为准)中已经显示出了正确的数字:
将修改后的.csv文件导入之后,别忘了更改含有大数字的列数据类型为bigint,否则会出现类似于下图的报错:
更改之后,就大功告成了~