1.代码如下
#统计文件中字符串出现的次数
import re
count = 0
f1 = open('文章.txt', 'r')
for s in f1.readlines():
li = re.findall('news', s)
if len(li) > 0:
count = count + li.count('news')
print(str(count) + '个news')
f1.close()
2.运行之后报错
UnicodeDecodeError: 'gbk' codec can't decode byte 0xa3 in position 12: illegal multibyte sequence
3.只用添加
f1 = open('文章.txt', 'r', encoding = 'utf-8')
4.文件内含有特殊字符,所以需要转换为utf-8格式输出,则必须在打开文件时添加encoding = 'utf-8