最近要修复一个xlsx,分析了下格式,查看最新更新请访问http://www.hkcat.org
xlsx是以zip格式压缩的,把xlsx重命名为zip,然后再解压。就可以得到里面的数据文件了。
_rels
docProps
xl
[Content_Types].xml
我们只重点查看xl目录下面的文件
sharedStrings.xml 这个文件保存着所有的字符串,比如”学生”,”编号”,”1号”等。
styles.xml 这个文件是样式,里面记载着单元格的格式,比如字体,日期格式等。
worksheets/sheet1.xml
worksheets/sheet2.xml
worksheets/sheet3.xml
对应三张工作表,具体名称依据你的xlsx里的工作表名称。
因为时间紧迫,所以我只分析sharedStrings.xml和sheet1.xml.其它文件的情况参见参考资料。
以这份xlsx为例,随便找2个空单元格合并下