本周进度 能够提取docx文档中的图片; 能够移除代码中的注释和空行,生成一个大字符串; 能够适应多种语言; 能够有docx标记的内嵌代码输出源代码文件; 能够由txt识别输出源代码文件。 下周目标 根据情况适时调整技术手段; 增加提取的效率; 考虑各种类型的融入; 转变方向,攻克一些更难解决的问题。