关于单词游戏软件的单词存库问题

              闲的没事干,就和同学组合写一单词软件。项目还在继续,首先是下载个年级的单词,然后入库。由于下载的单词格式不一样,最后将所下载的4个年级的单词格式统一一下,只存储英文,中文,毕竟刚开始做做的就比较简单。重点就是讲整理好的txt导入mysql中的时候,列和列之间的间隔符号要一致,即使是空格,数量也是一样的。

            现在说说我们存库的过程。

         (1)   由于文件是是word,而且文件的每张格式都不一样,所以只能用程序将文件中的单词,中文提取出来。过程本来不怎么复杂的。把每个文件的基本格式统一一下,每个文件都基本上不同,但是都可以用正则表达式来提取,由于正则表达式还不怎么熟,查查一看太多了,最后考虑再三,直接写程序,然后就是写了三次大概100行的程序将文件统一起来。辛苦呀,用了一天。然后用exce生成单词的id号,然后将中英文中文复制到excel中,中间当然要用空格隔开,

(2)然后复制到文本中,记住编号 id,英文,中文之间要用一种符号隔开,为了方便起见,英文或中文直接不能出现空格,这个是从excel复制到文本中的样子。

(3) 写程序,我们用的是c++,将列和列之间的空格一致,最简单的就是从一文本中一组(数字,字符串。字符串),然后输入到另一文件中,看图这个就是最终的文件。

 

(4)使用sql语句 load dai了ta InFile 'D:/Data.txt' Into Table `TableTest` Fields Terminated By ' ' Lines By '\r\n'  .这样将最后总生成的文本导入到数据库中。

 (5)最后发现有的单词会重复,这个怎么办?很简单,将单词消重之后,导出来,在excel中生成新的单词id,然后将去重的单词复制到excel,最后将整个excel复制到txt中,再将txt导入到数据库中。

这样就完了。其实过程很简单,只是做的时候没想好,过程走了很多的弯路。我想这是必须的。慢慢来.这个就是最后的表。结构简单,单词的id,单词都没有重复。刚开始存的时候有680个,少了很多,这个也减少了存储空间。

 

 

 

 

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值