1. 先说一个调试程序过程中的心得:
由于txt文本被Editplus处理后编码utf-8的格式好像有BOM之分,于是导致Java文件操作时出现首字节乱码问题。丫的,为什么不尝试新建个txt文件来测试,只是在那一个文件上死扣,调试bug时要注意分析控制变量。
2。解析json时很多乱码,比如出现多个国家的语言的地方。其实这些乱码是由于所用的文本编辑器的解码方式不同而造成的,可以用Editplus,选择一种合适的编码方式即可,这里解析的数据是USA那边的,选择了UTF-8+BOM,便可以解决。由于解析的文档较大,直接处理整个文本太耗内存,而且速度慢,于是每次拷一部分进temp.txt文档,然后对temp.txt文档解析,逐渐解析完毕。
3. 这里的工作介绍如下:知识单纯的读入一个存储JSON格式数据的文本,并将其解析为自定义的格式,然后存入到结果文本中,这篇博客的工作到此结束。之后的工作将文本读取转为一个字符串,并解析建数据库,将数据存入到数据库中,sqlserver2012。
下面是解析的JSON格式: