批量处理文本信息中的字符

最新推荐文章于 2024-10-11 16:40:06 发布

热力学负一定理

最新推荐文章于 2024-10-11 16:40:06 发布

阅读量272

点赞数 1

分类专栏：基础教程文章标签： matlab python

本文链接：https://blog.csdn.net/qq_33980829/article/details/120625144

版权

9 篇文章 1 订阅

订阅专栏

本文介绍了如何利用Word中的通配符匹配和编程语言如MATLAB、Python进行批量文本处理，特别是针对特定字符模式的查找与替换。通过实例展示了如何删除基因序列描述中的长度信息，并讨论了各种方法的优缺点。这种方法适用于快速处理单个文档，但在大量文本处理时，推荐使用编程语言以实现更复杂的操作。

摘要由CSDN通过智能技术生成

一、利于word中的通配符匹配

>CP041356.1:161019-161782 Lactococcus sp. KACC 19320 
CATACAGCGTGCTCCGCCACGGCCACGAGCCAGTTCACTAGAAAGAATTTCATGAACTTTGATACCGTGTTCTTTCAGAA

搜索栏中输入 [:][0-9]*(>[!-]@)

 整体表示为 寻找冒号后面任意0到9的数值到
 第二个大的空格部分结束
 [:] 表示 寻找冒号位置
 [0-9] 表示数值
 * 表示任意个
 >[!-]@ 除了空格前全部内容

尚：你发现没有，其他实验室中那些没有评上杰青的教授往往是最凶的。
董：是因为他们马上要评上了？？
尚：不是，他们经常会说“你谁呀你。"

关注

专栏目录