python分词代码_[代码全屏查看]-利用python进行分词,并绘制词云

[1].[代码] 分词

#!/usr/bin/env python

#-*-coding:utf-8-*-

import jieba

from wordcloud import WordCloud

import matplotlib.pyplot as plt

s1 = """ 在克鲁伊夫时代,巴萨联赛中完成了四连冠,后三个冠军都是在末轮逆袭获得的。

在91/92赛季,巴萨末轮前落后皇马1分,结果皇马客场不敌特内里费使得巴萨逆转。

一年之后,巴萨用几乎相同的方式逆袭,皇马还是末轮输给了特内里费。

在93/94赛季中,巴萨末轮前落后拉科1分。

巴萨末轮5比2屠杀塞维利亚,拉科则0比0战平瓦伦西亚,巴萨最终在积分相同的情况下靠直接交锋时的战绩优势夺冠。

神奇的是,拉科球员久基奇在终场前踢丢点球,这才有了巴萨的逆袭。"""

s2 = """ 巴萨上一次压哨夺冠,发生在09/10赛季中。末轮前巴萨领先皇马1分,只要赢球就将夺冠。

末轮中巴萨4比0大胜巴拉多利德,皇马则与对手踢平。

巴萨以99分的佳绩创下五大联赛积分纪录,皇马则以96分成为了悲情的史上最强亚军。"""

s3 = """在48/49赛季中,巴萨末轮2比1拿下同城死敌西班牙人,以2分优势夺冠。

52/53赛季,巴萨末轮3比0战胜毕巴,以2分优势力压瓦伦西亚夺冠。

在59/60赛季,巴萨末轮5比0大胜萨拉戈萨。皇马巴萨积分相同,巴萨靠直接交锋时的战绩优势夺冠。"""

mylist = [s1, s2, s3]

word_list = [" ".join(jieba.cut(sentence)) for sentence in mylist]

new_text = ' '.join(word_list)

wordcloud = WordCloud(font_path="F:\\WinPython-32bit-3.4.3.5\\python-3.4.3\\Lib\\site-packages\\matplotlib\\mpl-data\\fonts\\ttf\\msyh.ttf", background_color="black").generate(new_text)

plt.imshow(wordcloud)

plt.axis("off")

plt.show()

Python是一门流行的编程语言,有许多强大的库和工具可以用来处理中文文本数据,其中包括中文分词词云制作。 中文分词是将中文文本按照词语划分成一个个单独的词汇,是自然语言处理领域的重点问题之一。在Python中,最常用的中文分词库是jieba库。下面是一个简单的中文分词例子: ```python import jieba text = "我喜欢用Python做自然语言处理" words = jieba.cut(text) for word in words: print(word) ``` 这段代码将会输出分词后的结果: ``` 我 喜欢 用 Python 做 自然语言处理 ``` 接下来是词云制作。词云是一种用来展示文本数据的可视化图形,它将文本中出现频率高的关键词以不同的字体大小和颜色呈现在图形中。在Python中,我们可以使用wordcloud库来制作词云。下面是一个简单的词云制作例子: ```python from wordcloud import WordCloud import jieba text = "我喜欢用Python做自然语言处理" # 使用jieba进行中文分词 words = jieba.cut(text) words_list = " ".join(words) # 生成词云 wordcloud = WordCloud(width=800, height=600, background_color="white").generate(words_list) # 保存词云图片 wordcloud.to_file("wordcloud.png") ``` 这段代码将会生成一张名为wordcloud.png的词云图片。如果你想要将词云显示在Jupyter Notebook中,可以使用下面的代码: ```python from IPython.display import Image Image(filename="wordcloud.png") ``` 这样就可以在Jupyter Notebook中显示词云图片了。 以上就是用Python做中文分词词云制作的简单例子,希望能对你有所帮助!
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值