用python进行文本分析_用Python分析文本文件

本文档描述了作者如何尝试使用Python 2.7.3解析包含多种分隔符的文本文件,并将其转换为CSV格式。作者面临的问题是无法处理整个文件,而不仅仅是单行数据。代码中定义了一个"data_parser"函数,用于替换文本中的特定字符串,但遇到了列表对象不支持`replace`方法的问题。示例代码展示了如何读取文件并跳过前四行,以及定义了一个字典来处理不同的分隔符。
摘要由CSDN通过智能技术生成

我试图解析一系列文本文件,并使用Python(2.7.3)将它们保存为CSV文件。所有文本文件都有一个4行长的头,需要删除。数据行有各种分隔符,包括“(引号)、—(破折号)、:列和空格。我发现在C++中用所有这些不同的分隔符来编码它是一种痛苦,所以我决定在Python中尝试它比C/C++更容易。

我写了一段代码来测试一行数据,它工作了,但是,我无法让它工作在实际的文件中。为了解析一行代码,我使用了文本对象和“replace”方法。看起来我当前的实现将文本文件读取为列表,并且列表对象没有替换方法。

作为一个Python新手,我被困在这一点上。任何意见都将不胜感激!

谢谢!# function for parsing the data

def data_parser(text, dic):

for i, j in dic.iteritems():

text = text.replace(i,j)

return text

# open input/output files

inputfile = open('test.dat')

outputfile = open('test.csv', 'w')

my_text = inputfile.readlines()[4:] #reads to whole text file, skipping first 4 lines

# sample text string, just for demonstration to let you know how the data looks like

# my_text = '"

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值