002_006 Python 处理文件中的每个单词

代码如下:

#encoding=utf-8

print '中国'

#处理文件中的每个单词 假定词由空格分开

''' D:\123.txt的内容如下:
1 a b c 中 国
2 a b c 中 国
'''

#方案一
print '------1'
file_object = open(r'd:\123.txt','rU')

for line in file_object:
    for word in line.split():
        print word

file_object.close()

#方案二 正则表达式 不支持中文
print '------2'
import re
re_word = re.compile(r"[\w'-]+")

file_object = open(r'd:\123.txt','rU')

for line in file_object:
    for word in re_word.finditer(line):
        print word.group(0)

file_object.close()

#方案三 封装成迭代器
print '------3'

def wordsoffile(thefilepath, line_to_words = str.split):
    the_file = open(thefilepath)
    for line in the_file:
        for word in line_to_words(line):
            yield word
    the_file.close()
    
for word in wordsoffile(r'd:\123.txt'):
    print word

打印结果如下:

中国
------1
1
a
b
c


2
a
b
c


------2
1
a
b
c
2
a
b
c
------3
1
a
b
c


2
a
b
c


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

书山登峰人

精品不易

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值