学习心得
- getcwd():取得当前的工作目录
- import matplotlib.pyplot as plt: 绘图使用,matplotlib是一个绘图库
- utf-8:一种编码格式
- r:只读模式
- font:设置字体属性 (引入电脑中的中文字体)
- generate():生成文本
- plt.imshow():热图绘制,显示图片+格式
- plt.show():加上之后变为仅显示图片,不显示格式
- plt.axis():具体设置某一坐标轴属性
- to_file():存入文件
- 一二百个词做出来的词云是最好看的
- jieba库:中文分词第三方库
- jieba库的分词模式:
- 3.jieba.load_userdict('userdict.txt') :自定义词典(在TXT文档中怎么分词,运行出来就会怎么切分)
1.jieba.posseg:用于标注词性(每个词后面的符号代表不同词性)
- 打开文件时注意转换编码格式utf-8
- pop() 函数用于移除列表中的一个元素(默认最后一个元素),并且返回该元素的值。
- list():将元组转换成列表
1. PIL是一个图像处理库,主要目的是提取图像作为词云图的轮廓,即遮罩mask,这个函数为mask=np.array(image.open(“heart.png”)) (需要导入import numpy as np)
1. ImageColorGenerator:词云颜色生成器