基于Python的删除子串处理案例

最新推荐文章于 2022-10-17 09:13:04 发布

小游园

最新推荐文章于 2022-10-17 09:13:04 发布

阅读量669

点赞数 3

分类专栏：智能钻完井油田大数据 Python在石油工程中应用

本文链接：https://blog.csdn.net/s0302017/article/details/103763868

版权

本文介绍如何在自然语言处理中使用Python处理文本数据，具体操作包括读取文本文件，删除每条文本数据开头和中间特定子串，然后将处理后的数据写入新文件。

摘要由CSDN通过智能技术生成

问题描述

在做自然语言处理时，经常遇到从文本文件中读取字符串，并删除其中不需要的内容。本案例给出一种基于Python的处理方法，删除读取到的文本数据中具有规律性但是不需要的数据。基本流程为：读取文本文件（每一行存储一条文本数据），删除每个字符串开头部分的子串，再删除中间某一段子串，最后把清理后的字符串写入一个文本文件。

算法实现

#读取文本文件
def ReadTxtFile( fileName ):
    with open( fileName, mode = 'r', encoding = 'utf-8' ) as fp:
        lineNum = 0
        dataTxt = []
        for line in fp:
            if lineNum < 5: #只读取前5行
                lineNum += 1
                dataTxt.append( line )
            else:
                break
    return dataTxt, lineNum
#删除不需要的子串
def DeletePartTxtData( dataTxt, lineNum ):
    data = []
    ind = 0
    txt =[]
    for i in range( lineNum ):
        txt = str( dataTxt[i] )
        ind = txt.find( &#

最低0.47元/天解锁文章

小游园

关注

3
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
基于Python的删除子串处理案例

问题描述在做自然语言处理时，经常遇到从文本文件中读取字符串，并删除其中不需要的内容。本案例给出一种基于Python的处理方法，删除读取到的文本数据中具有规律性但是不需要的数据。基本流程为：读取文本文件（每一行存储一条文本数据），删除每个字符串开头部分的子串，再删除中间某一段子串，最后把清理后的字符串写入一个文本文件。算法实现#读取文本文件def ReadTxtFile( fileNam...
复制链接

扫一扫

专栏目录