经过层层努力还是失败了。。TMD实在是有懒得找格式统一的题目的网站了。
但是,段某人眉头一皱发现事情还可以更加复杂
于是百度下了一份word,标题是小学语文选择题100道,寻思,哎?还挺好。下载。文档如下:
中间发现了一些可执行的逻辑,于是使用notepad++的正则+替换手段改成:
格式大概就是
题目
选项A
选项B
选项C
选项D
然后使用python文件流
#函数3,读取搜索文件内容
def search_file():
fp=open('searchfile.txt')
i=0
keyword=fp.readline()
subject = []
optionA = []
optionB = []
optionC = []
optionD = []
while keyword:
nPos = keyword.find('\n')
if nPos > -1:
keyword = keyword[:-1] # keyword.replace('\n','')
if (i+4) % 5 == 0:
optionA.append(keyword)
if (i+3) % 5 == 0:
optionB.append(keyword)
if (i+2) % 5 == 0:
optionC.append(keyword)
if (i+1) % 5 == 0:
optionD.append(keyword)
if i%5==0:
subject.append(keyword)
i=i+1
keyword = fp.readline()
indexi = 0;
for i in subject:
print subject[indexi] + "\t" + optionA[indexi] + "\t" + optionB[indexi] + "\t" + optionC[indexi] + "\t" + optionD[indexi] + "\t"
indexi = indexi+1
#脚本入口
print('Start:')
search_file()
print('End!')
结果为:
1、下列字母的排列顺序错误的一组是( B ) A、ABCDEF B、JMMKLG C、OPQRST D、UVWXYZ
2、下列大小形式互换完全正确的是( B ) A、T t Wu B、Y y N n C、G g L I D、Q p R r
3、读音节,注意声调,选出调号有错误的一组( C ) A、水平如镜shuǐ píng rú jìng B、桃李争妍táo lǐ zhēng yán C、开卷有益kāi juǎn yǒu yì D、完好无损wán hǎo wú sǔn
4、下面字形和读音都正确的一组是( B ) A、倾(qīng)盆大雨 B、磨(mò)房 C、一担(dàn) D、眼眶(kuāng)
5、“壮”这个字如果用音序查字法来查的话,应查( A ) A、Z B、zh C、zuàng D、zhuàng
6、按要求朗读,重音标示错误的一组是( A ) A、今年我上五年级。(不是明年) B、吴昊喜欢踢足球。(不讨厌踢足球) C、南京是江苏省的省会(其它的城市不是) D、这是我的语文书(不是别人的)
7、下面读音错误的一组是( D ) A、解(xiè)狐 B、解(jiě)落三秋叶 C、解(jiě)说员 D、押解(jiě)
8、下面的字,书写笔画顺序不正确的一个是( D ) A、长 B、方 C、出 D、再
9、下列词的字形错误的一组是( A ) A、桥梁 B、漂流 C、资态 D、侮辱
10、下列字形正确的一组是( D ) A、锻练 B、署假 C、遵敬 D、一丝不苟
11、“释”这个字用部首查字法应查部首(D) A、木 B、米 C、又 D、采
12、“塞”在字典中有如下解释:①塞子;②边关,塞外;③重要的地方; ④把窟窿堵住。在“军事要塞”这个词中它应选( B ) A、① B、② C、③ D、④
13、下列字中跟“龄”字造字方法不一样的字是( B ) A、堡 B、蝴 C、园 D、休
14、下列每组中相同的两个字读音也相同的一组是( A ) A、怒发冲冠 千钧一发 B、发人深省 江苏省 C、落花流水丢三落四 D、挨打挨挨挤挤
因为每一行都有\t所以Ctrl+C Ctrl+V扔进excel里:
copy第一列之后把答案提取出来,这里的代码没有保存。。 逻辑是取到括号里的里含有非空格的值然后提取出来存入excel第6列中
简单写个POI导入存入数据库
OK,现在数据也有了