二维数据的表示:
类表类型可以表示二维数据
[ [424,23423,2342],[131,535,3646] ]
使用两层for循环可以便利每个元素
外层列表中每个元素可以对应一行,也可以对应一列
一维数据分为列表和集合类型,二维数据只有列表类型
CSV数据存储格式
国际通用的一二维数据存储格式,一般.csv扩展名,每行一个一维数据,采用逗号分隔,无空行
Excel软件可读入输出,一般编辑软件都可以产生,如果某个元素缺失,逗号仍要保留,
二维数据的表头可以作为数据存储,也可以另行存储,
一般索引习惯,ls[row][cokumn],先行后列
二维数据的处理:
从CSV格式的文件中读入数据
fo = open(fname)
ls = []
for line in fo:
line = line.replace("\n","")
ls.append(line.split(","))
fo.close()
二维数据的写入处理
ls = [[],[],[]]
f = open (fname,'w')
for item in ls:
f.write(','.join(item) + '\n')
f.close()
二维数据的逐一处理:
ls = [[],[],[]]
for row in ls:
for column in row:
print(ls[row][column])
wordcloud库的使用:
cmd 命令行:pip install wordcloud
wordcloud.WordCloud()代表一个文本对应的词云
wordcloud库常规方法
w=wordcloud.WordCloud()
方法
描述
w.generate(txt)
向对象w中加载文本txt,
>>>w.generate("afwawfawf")
w.to_file(filename)
将词云输出为图像文件,.png或.jpg
>>>w.to_file("outfile.png")
配置对象参数:
参数
描述
width
指定词云对象生成图片的宽度,默认400像素
>>>w = wordcloud.WordCloud(width=600)
height
高度,默认200
min_font_size
指定词云中字体的最小字号,默认4号
max_font_size
最大字号,根据高度自动调节
fount_step
指定词云中字体字号的步进间隔默认为1
fount_path
指定字体文件的路径,默认None
>>>w =wordcloud.WordCloud(font_path="msyh.ttc")
max_words
指定词云最大单词数量,默认20
stop_words
指定词云的排除词列表,
mask
指定词云形状,默认为长方形,需要引用imread()函数
>>>from scipy.misc import imread
>>>mk = imread("pic.png")
>>>w = wordcloud.WordCloud(mask=mk)
background_color
指定词云图片的背景颜色,默认为黑色