我昨日(2020年9月20日)设计了一份Python代码,用正则表达式,查询成语之包含特定汉字者。代码如下:
import re
def data_read(filepath):
global lines
idiom = open(filepath, "r")
lines = idiom.readlines()#读取整个文件数据
lines = [line.strip() for line in lines]
idiom.close()
data_read("/home/abc/Desktop/igyu/idiom.txt")
methods = ['.*(名|实).*', '.*名.*实.*', '.*实.*名.*', '.*名.*利.*']
print('Methods:', methods)
result = []
i = int(input('Which method do you want to choice?'))
for line in lines:
if re.search('{}'.format(methods[i]), line) != None:
result.append(line)
print(result)
先将成语词库数据(这里即'/home/abc/Desktop/igyu/idiom.txt',我之前下载好的),导入列表。
再根据既有的检索方法,之用正则表达式定义在methods列表者,选择其中一种方法,来检索词库列表。诸方