- 博客(0)
- 问答 (2)
- 收藏
- 关注
.rtf转.txt程序源码
是否为文件格式转换感到烦恼?自己写程序,是否面临过以下问题:
1. 中文文件名无法读取
2. 遍历文件夹不彻底,分不清文件和文件夹
3. 各种形式的文件比较杂乱,不知如何筛选得到想要的文件
作者打算做一个系列,专攻各种形式的格式转换,最后集合成模块开源供大家使用。利用Python自身功能,到调用其他软件与模组,都会有。
这是第一个版本,唯一的bug在于如果文件夹层数比较多,不能第一次就修改完所有非法文件名,但是多运行几次就可以了!
第二个版本正在光速赶来,预期包含筛选文件类型、输出文件夹目录结构等进阶功能。欢迎大家多多留言,说出你需要的功能,我们一起促成良性互动。
作者主要领域在文本分析、话语分析与自然语言处理,其中涉及到很多语料的格式转换、清晰、标注,再到后面的分词、降维、建模。因此会自己设计一些“无用小发明”。之所以后续开源,是真心希望这些东西能够帮助到国内语言学科的发展,为后来者做类似研究扫清不必要的障碍。不过,自己摸爬滚打的过程也非常难能可贵。
创作不易,希望大家多多支持。
数据无价,大家处理前切记备份!备份!备份!
2023-03-22
如何在M1 Mac OS上制作安卓模拟器键盘映射?
2023-11-04
请帮我回忆一个超实用的Python的语法糖!
2023-03-04
Python sklearn fit_transform()函数报错
2022-02-22
TA创建的收藏夹 TA关注的收藏夹
TA关注的人