截图不能显示。。。
1.concordance:上下文一起出现, text1.concordance(“monstrous”)
2.similar:用来搜索相似词,text1.similar(“monstrous”)
3.common_contexts:研究共用2个或者2个以上的词汇的上下文。,找到它两相似的词 text2.common_contexts([‘monstrous’,’very’])
4.dispersion_plot: text4.dispersion_plot([‘citizens’,‘democracy’,‘freedom’,‘duties’])
横坐标表示文本的单词位置.纵坐标表示查询的单词, 坐标里面的就是,单词出现的位置.
5.Len(),set(),sorted(),text1.count(),text4.index()
6.sent1.append()
7.切片:text1[2:46]
8.大写字母>小写字母,[:4]:0,1,2,3
9.’ '.join([‘monty’,‘python’]):monty python,必须是[]
10.FreqDist():词语频率分布,fdist1=FreqDist(text1),fdist1.plot(20),不是线性的fdist1.plot(20,cumulative=True),是线性序列,逐渐变大
11.hapaxes():出现一次的词语
12.元组使用(),列表使用[],集合set()({})。
13.bigrams():双连词。collocations():词语搭配
14.FreqDist([len (w) for w in text1]):数字出现的次数
15.以频率递减顺序排序的样本链表fdist=FreqDist([len (w) for w in tex
nlp基本命令
最新推荐文章于 2023-09-09 06:41:59 发布