凌乱没有章程的小结,佛系小结,个人学习
1. 文件读写
# 1. with open方式,可以同时打开多个
with open(filename, 'w', encoding='UTF-8') as myfile:
myfile.writelines(str(buf))
# 2. open
src = 'D:/0_DATA/wikidata/FF/wiki_' + lf[i] + '.txt' # 格式:title #len #链出数 #链入数
src = open(src, 'r', encoding='UTF-8')
line = src.readline()
while(line):
# ...
line = src.readline()
读写方式:r | w | rb | wb | a
2. 字符串处理
str.strip() # 去除首尾空格和换行
str.strip('substr') # 去除首尾指定字符串
str.split('substr') # 去除串中指定字符串,可以通过 ‘|’,按多个子串匹配
reslist = re.findall("model", str) # 字符串匹配,model是正则表达式,找到串中所有和model匹配的子串,需要 import re
res = re.search("model", str, flags) # 找到串中第一个和 model 匹配的子串,flags匹配规则,如大小写是否敏感
res = res.match("model", str, flags) # 从字符串开始就匹配
res = res.split("model",str) # 按匹配到的子串分割str