批量导入数据---保存数据到数据的处理

1.    
在试图获取到HTML文本数据通过post提交方式提交数据到控制器,提交到数据库中后需要对数据进行解码才能使用

获取到“***类试题
 
一、单选题
题型:单选题难度:一般适用单位:重庆高教保卫学会题序:0001
知识点:
交通
题干:
小陈乘坐的客车在高速公路上发生故障,不能继续行驶,这时他应当()
A.在车上等候救援
B.在车辆后方协助疏导
C.站在车辆前方躲避
D.撤离到护栏以外的安全地带
答案:
D
 
题型:单选题难度:一般适用单位:重庆高教保卫学会题序:0002
知识点:
交通
题干:
 img1遇到前方设有以上标志时,行人()
A.不能通行
B.可以通行
C.没有车辆可以通行
D.有急事可以通行
答案:
A
 

”这种数据,多条数据拼接起来的,然而我们保存到数据库的数据是这种形式的:“灭火器出现下列(  )情形,必须报废。~~A.筒体严重锈蚀的
;~~B.筒体严重变形的;~~C.被火烧过的;D.无生产厂名称和出厂年月的;”所以我们还需要对上面获取到的数据进行下一步的处理,从上面可以通过对比从试图传过来的数据和存在数据库的数据的差异而确定我们接下来需要如何处理数据。首先可以看出传过来的数据是有一些
标签标签等标签的,然而我们保存到数据库中是不需要的我们只要字段而不需要标签,同时还可以看出在选项ABCD等等的前面都多了“
”,还有值得一提的是获取到的是多条数据拼接起来的数据,而保存到数据库是一条条数据分开保存的,所以我们先通过正则表达式去处理传递过来的数据,

1.通过 titlesInfor
= Regex.Replace(titlesInfor,
"<a[^>].+?/a>| ", “”);去掉a标签和空格&nbsp

2.通过titlesInfor = Regex.Replace(titlesInfor,

[\s][A-Z]{1}[\s][.、.]”, "$+"); 在答案选项前面加上

3.声明多个列表去接收不同字段的数据

List listStemStr = new List();

//题目类型

List
listTitleTypeStr = new List();

//难度

List listDofdStr = new List();

//知识点

List listPointStr = new List();

//答案

List listRightKeyStr
= new List();

//错误数据

List
listErrorDataStr = new List();

//

List listData = new List();

//说明试题的科目ID和使用单位通过view传递到控制器中的

MatchCollection matchs = Regex.Matches(titlesInfor,
“题型[::].+?

”);//获取每道题组成一个集合

4然后通过from循环去循环分割数据,将分割出来的数据用数组保存起来,再把数据保存到列表,所以这时候得到多个列表,每一个列表都对应一个字段(如:题型:单选题等),多个字段组合取相同位置的数据组合起来就是组合成一条试题数据;

for (int i = 0; i <
matchs.Count; i++)

{

if (matchs[i].Success)

{

string titleInfor =
matchs[i].Value;

try

{

//用replacefangf方法将题型:这几个字去掉

titleInfor = Regex.Replace(titleInfor,
“题型[::]”, “”);

//用Split将题目类型分割出来 titleInfor[0](题目类型:单选题或者多选题)

string[] strTitleType = Regex.Split(titleInfor, “难度[::]”);//得到一个集合里面有两个元素,第一个是题型,第二个是除了题型之外的其他元素

//分割出难度系数strDofd[0]难度系数

string[] strDofd = Regex.Split(strTitleType[1],
“适用单位[::]”);

//适用单位

string[] strUnit = Regex.Split(strDofd[1], “题序[::].+?
知识点[::]
”);

//知识点

string[] strPoint = Regex.Split(strUnit[1], “
题干[::]
*”);

//题干信息

string[] strStem = Regex.Split(strPoint[1], “
答案[::][\s]
”);

//答案

string[] strsRightKey = Regex.Split(strStem[1], “

*”);

//只能有文字

Regex rege = new Regex("[\u4e00-\u9fa5]+");

Match matchTitleType =
rege.Match(strTitleType[0]);//题型

Match matchDofd =
rege.Match(strDofd[0]);//难度系数

Match matchPoint =
rege.Match(strPoint[0]);//知识点

//将获取匹配到的值保存到list

strStem[0] = Regex.Replace(strStem[0],

”, “”);

listStemStr.Add(strStem[0]);//题目与选项

listPointStr.Add(matchPoint.Value);//知识点

listDofdStr.Add(matchDofd.Value);//难度

listTitleTypeStr.Add(matchTitleType.Value);//题型

//验证答案是否超出范围

string strRightKey = Regex.Match(strsRightKey[0],
“[A-J]+”).Value;

listRightKeyStr.Add(strRightKey);//答案

listData.Add(titleInfor);   //除了题型之外的其他数据

}

catch(Exception)

{

var errorInfor = Regex.Replace(titleInfor,
“~~”, “”);

listErrorDataStr.Add(errorInfor);

}

}

}

4.将每个字段都保存导数据库中之前需要去判断一下是否有重复的试题,如果没有重复的试题那么就把所以的字段数据添加到数据库中

5.注意,如果试题有图片那么图片需要另作处理,以为图片我们不是保存到数据库中的,图片的本身是保存到项目的目录里去的,而图片的信息保存到数据库的只是保存图片的链接到数据库中

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值