bow_text =[]for t in text:
t = t.replace(',',' ').replace('.',' ').split(' ')
new_t =[]for w in t:iflen(w)>1:
new_t.append(w)
bow_text.append(new_t)
bow_text
wordSets =[]for i in bow_text:
wordSets+=i
wordSets=set(wordSets)
wordSets
{'不想','不要','两回事','好听','就是','巫山','弱水','感觉','没有','沧海','的话','相思'}
统计text中每个元素中每个单词出现次数
wordDicts =[]for list_ in bow_text:
wordDict=dict.fromkeys(wordSets,0)for word in list_:
wordDict[word]+=1
wordDicts.append(wordDict)
wordDicts
[{'巫山':0,'沧海':0,'好听':0,'不要':0,'弱水':0,'感觉':0,'就是':0,'不想':1,'两回事':1,'的话':0,'没有':0,'相思':0},{'巫山':0,'沧海':0,'好听':1,'不要':1,'弱水':0,'感觉':1,'就是':1,'不想':0,'两回事':0,'的话':1,'没有':1,'相思':0},{'巫山':1,'沧海':1,'好听':0,'不要':0,'弱水':1,'感觉':0,'就是':0,'不想':0,'两回事':0,'的话':0,'没有':0,'相思':1}]