Python常用的文本处理代码整理

最近在新入职的公司中,组里有很多人都在使用Python进行开发,自己也试着学习和整理了一下平时经常会使用到的工具类,其中有很多也是借鉴了网上的很多帖子,供大家参考。
需要注意的是:在文件处理的各种问题中,别忘记的一点就是对字符集的指定,否则会出现字符集相关的bug。

1. txt转换成csv

target = open(r"test.csv","a") #最终写入的csv文件的绝对路径
with open(r"test.txt",'r') as lines :  #读取的txt文件的绝对路径
    for line in lines :
        # print(type(line))
        newline = line.replace("&",",") # 指定txt文件每行中多个字段的分隔符,将其替换成,
        target.write(newline)
target.close()

2. txt转换成Excel

方式一:

import os
import xlwt
import datetime
import re

def create_and_write_data_to_excel(p_file_name_prefix=None, p_sheetname=None, p_data=None):
    try:
        wbk = xlwt.Workbook()
        if p_sheetname is None:
            p_sheetname = 'Sheet1'
        sheet = wbk.add_sheet(p_sheetname, cell_overwrite_ok=True)
        for i in range(len(p_data)):
            for j in range(len(p_data[i])):
                sheet.write(i, j, p_data[i][j])
        filename = p_file_name_prefix + datetime.datetime.now().strftime("%Y-%m-%d_%H-%M-%S") + ".xls"
        wbk.save(filename)
        return wbk
    except:
        print("------")
        pass

if __name__ == '__main__':
    # module_path = os.path.dirname(__file__)
    # filename = module_path + '/report_db_20180301_20180302_11881.2_0_100_gdt.txt'
    filename = r"D:\DevSoftware\IDEA\IntelliJ IDEA 2019.1.3\workspace\JIGUANG-PYTHON\com\jiguang\python\utils\表一.txt"
    """
    txt 内容
    gdt 20180301 -1.0000 6 2 0.3333 -0.1667 -0.5000
    gdt 20180302 -1.0000 4 1 0.2500 -0.2500 -1.0000
    gdt SUM 11881.2000 10 3 0.3000 1188.1200 3960.4000
  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: 如果您希望筛选并整理 txt 文件的文本,您可以使用 Python 语言来实现。 首先,您需要读取 txt 文件并将其中的内容读取到一个字符串变量中。您可以使用 Python 的内置函数 open() 和 read() 实现这一点。例如: ``` with open('text.txt', 'r') as f: text = f.read() ``` 然后,您可以使用字符串函数来筛选文本。例如,您可以使用 find() 函数来查找指定的字符串,或者使用 split() 函数来按照指定的字符将文本分割为多个部分。 您还可以使用正则表达式来筛选文本。正则表达式是一种用于匹配文本模式的工具,可以帮助您快速筛选出符合特定条件的文本。要使用正则表达式,您需要先导入 Python 的 re 模块。例如,您可以使用 re.findall() 函数来查找符合正则表达式的所有文本,或者使用 re.sub() 函数来将符合正则表达式的文本替换为其他内容。 最后,您可以使用 Python 的内置函数 write() 将整理后的文本写入新的 txt 文件中。例如: ``` with open('cleaned_text.txt', 'w') as f: f.write(cleaned_text) ``` 希望这些信息能帮到您! ### 回答2: txt文件的文本筛选与整理代码可以使用Python编程语言来实现。首先,我们需要读取txt文件并将其内容存储在一个字符串中。可以使用`open()`函数打开txt文件,并使用`read()`方法读取文件内容,保存在一个变量中。 接下来,我们可以使用正则表达式来进行文本的筛选。正则表达式是一种用来匹配文本模式的强大工具。通过定义一些针对文本模式的规则,我们可以筛选出需要的文本。 假设我们要筛选出所有包含特定关键词的文本行,可以使用`re`模块中的`search()`函数来搜索匹配的文本行。通过在正则表达式中指定关键词,函数可以返回第一个匹配的文本行。我们可以使用循环遍历所有的文本行,然后使用`search()`函数来寻找匹配的文本。 筛选出需要的文本后,我们可以对文本进行整理和处理。可以使用字符串的各种方法来删除不需要的字符或格式化文本。例如,可以使用`strip()`方法删除文本行首尾的空格或换行符。还可以使用`replace()`方法替换特定的字符串。 最后,我们可以将处理后的文本写入一个新的txt文件中。通过使用`open()`函数与`write()`方法,我们可以创建一个新的txt文件,并将处理后的文本写入其中。这样就完成了文本筛选与整理代码。 总结起来,筛选与整理txt文件的文本可以通过Python的文件读写和字符串处理的相关函数与方法来实现。这些代码可以根据文本的具体需求进行定制,以满足不同的应用场景。 ### 回答3: 对于txt文件的文本筛选与整理,可以使用编程语言来编写代码进行处理。以下是一种可能的代码实现方式: 首先,我们需要打开txt文件,并读取其中的文本内容。可以使用Python的open()函数以及read()函数来实现,例如: ``` file = open('example.txt', 'r') # 打开文件 text = file.read() # 读取文件内容 file.close() # 关闭文件 ``` 接下来,可以对读取到的文本内容进行筛选与整理。假设我们希望提取文件中的所有英文字母和数字字符,可以使用正则表达式进行匹配,并使用re模块进行处理。例如,下面的代码将提取出所有的英文字母和数字字符: ``` import re filtered_text = re.findall(r"[a-zA-Z0-9]+", text) # 使用正则表达式提取英文字母和数字字符 ``` 接着,我们可以对提取出的内容进行进一步的整理和处理。例如,我们可以对提取出的英文字母字符进行小写化或者大写化,可以使用Python的lower()函数或者upper()函数来实现: ``` processed_text = [word.lower() for word in filtered_text] # 将提取出的英文字母字符进行小写化 ``` 最后,我们可以将整理好的文本内容输出到一个新的txt文件中。可以使用Python的open()函数以及write()函数来实现,例如: ``` output_file = open('output.txt', 'w') # 打开新文件(如果文件不存在则创建) output_file.write(' '.join(processed_text)) # 将整理好的文本内容写入文件 output_file.close() # 关闭文件 ``` 综上所述,以上代码实现了对txt文件的文本筛选与整理,包括打开文件、读取文本、筛选提取、处理整理以及输出到新文件中。具体的实现方式可以根据实际需求进行调整和修改。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值