首先是一个小知识,Python参数中的args 是 arguments 的缩写,表示位置参数;kwargs 是 keyword arguments 的缩写,表示关键字参数。args本质是一个tuple,kwargs本质是dict
1.open(路径,格式)
打开文件,需要关闭
例:
try:
myFlie = open('/path/to/file', 'r')
print(myFlie .read())
finally:
if myFlie :
myFlie.close()
2.with open(路径,格式) as myFile
打开文件并自动关闭(myfile是自定义变量)
例:
with open( '/path/to/file', 'r' ) as myFile:
print(myFlie.read())
3.xxx.strip([chars])
删除一个字符串开头结尾的指定字符,参数可以为空,为空时去除空白符
例:
>>> ' spacious '.strip()
'spacious'
>>> 'www.example.com'.strip('cmowz.')
'example'
4.readlines(),readline(),read()
read()读整个文件,readline()和readlines()一行一行读文件,用法是
for line in myFile.readlines():
print line
其中readlines是一次读取整个文件再逐行处理,比readline效率更高,但会占用更多空间。空间充足时使用readlines更好,空间不足就只能用readline。
5.jieba.lcut(string)
一种切割字符串的方式,对中文文本进行切分
详见python中lcut啥意思_python学习笔记——jieba库入门_weixin_39634576的博客-CSDN博客
6.d.get(key,value)
如果字典中存在关键字key,则返回关键字对应的值;如果字典d中不存在关键字key,则返回value的值,一般默认为None,也可以返回指定的value值
7.list()
将任何可迭代数据转换为列表类型,并返回转换后的列表。当参数为空时,list函数可以创建一个空列表
8.list.sort( key=None, reverse=False)
key -- 主要是用来进行比较的元素,只有一个参数,具体的函数的参数就是取自于可迭代对象中,指定可迭代对象中的一个元素来进行排序。
reverse -- 排序规则,reverse = True 降序(从大到小), reverse = False 升序(从小到大)(默认)。
可以结合lambda使用
novelListSorted = list(novelDict.items())
novelListSorted.sort(key=lambda e: e[1], reverse=True)
# 按novelListSorted中每个元组的第二个属性从大到小排序
9.lambda
一个匿名函数,可以作为参数传递
lambda x, y: x*y # 函数输入是x和y,输出是它们的积x*y
lambda:None # 函数没有输入参数,输出是None
lambda *args: sum(args) # 输入是任意个数参数,输出是它们的和(隐性要求输入参数必须能进行算术运算)
lambda **kwargs: 1 # 输入是任意键值对参数,输出是1
lambda x: x[0] # 输入是元组x,输出是x的第一个元素
10.[start:end:step]
分别表示开始位置、结束位置和步长,都可以为空。只有一个冒号就是start和end
11.plt.plot(x,y,color)
绘制图像,可以填入横纵坐标值、颜色等属性
详见plt.plot() 函数详解 - 知乎
12.plt.axis()
更改坐标轴的一些属性,如plt.axis('off')去掉坐标轴,详见plt.axis()用法详解_那一勺甜的博客-CSDN博客
13.imread()
读取一张图片,可以作为下面的mask参数值
14.WordCloud(mask,background_color,scale,font_path)
配置词云属性,mask是形状,background_color背景颜色,scale缩放度,越大越清晰,font_path设置字体所在的路径
15.WordClound().generate(string)
生成词云图
例:
WordCloud(mask=bg_pic,background_color='white',\
scale=1.5,font_path=r'msyh.ttc').generate(' '.join(novelDict.keys()))
16.plt.imshow(X, interpolation=None)
读取X图像,其中interpolation是插值方式,详见plt.imshow_harry_tea的博客-CSDN博客