向SQL Server 中导入长文本数据(如小说、报告)进行分析时,有一些细节需要注意,这里将流程做一个梳理:
以每个段落作为一行进行导入
新建表
在想要导入的数据库中新建一个表:
这里设置了三列,no, contents 和 book 分别表示列序号、内容和来自哪本书。
这里的数据格式默认为varchar(10)。对于contents,varchar能够容纳的内容实在太少,需要改成最大的nvarchar(MAX)。对于列序号,想要它自动生成序号,因此将数据格式改为bigint后在列属性中的标志规范里设置为是标识符。
表名保存为“book”。
导入数据
在Management Studio 中右键需要插入的数据库,选择“任务”->“导入数据”
数据源设置
一路下一步,数据源选择平面数据源。
“列”选项中可以调整分隔符,预览行。