展开全部
按照你的思路62616964757a686964616fe58685e5aeb931333337613932,以/为分割条件
使用字符串的find方法
S.find(substr, [start, [end]])
#返回S中出现substr的第一个字母的标号,如果S中没有substr则返回-1。start和end作用就相当于在S[start:end]中搜索
查找到/ask/之后出现的第一个/
这样可以得到两个/之间的这个单词,也就是分类的名字
计数问题可以使用python字典来进行,key不会重复,相同的key对value+1keywords = {}
start_idx = 5
with open('C:\\Users\\admin\\Desktop\\a.txt') as f:
for line in f:
idx = line.find('/',start_idx)
if idx != -1:
key = line[start_idx:idx]
if keywords.has_key(key):
keywords[key] += 1
else:
keywords[key] = 1
print keywords
以上代码仅供参考