自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(0)
  • 问答 (2)
  • 收藏
  • 关注

空空如也

.rtf转.txt程序源码

是否为文件格式转换感到烦恼?自己写程序,是否面临过以下问题: 1. 中文文件名无法读取 2. 遍历文件夹不彻底,分不清文件和文件夹 3. 各种形式的文件比较杂乱,不知如何筛选得到想要的文件 作者打算做一个系列,专攻各种形式的格式转换,最后集合成模块开源供大家使用。利用Python自身功能,到调用其他软件与模组,都会有。 这是第一个版本,唯一的bug在于如果文件夹层数比较多,不能第一次就修改完所有非法文件名,但是多运行几次就可以了! 第二个版本正在光速赶来,预期包含筛选文件类型、输出文件夹目录结构等进阶功能。欢迎大家多多留言,说出你需要的功能,我们一起促成良性互动。 作者主要领域在文本分析、话语分析与自然语言处理,其中涉及到很多语料的格式转换、清晰、标注,再到后面的分词、降维、建模。因此会自己设计一些“无用小发明”。之所以后续开源,是真心希望这些东西能够帮助到国内语言学科的发展,为后来者做类似研究扫清不必要的障碍。不过,自己摸爬滚打的过程也非常难能可贵。 创作不易,希望大家多多支持。 数据无价,大家处理前切记备份!备份!备份!

2023-03-22

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除