文件和数据格式化
二维数据的格式化和处理
-
二维数据的表示
列表类型可以表达二维数据
-
CSV数据存储格式
CSV:Comma-Separated Values
这是一种国际通用的二维数据存储格式,一般以.csv扩展名,每行一个一维数据,采用逗号分隔,无空行
如果某个元素缺失,逗号仍要保留;二维数据的表头可以作为数据存储,也可以另行存储;逗号为英文半角符号,逗号与数据之间无额外的空格 -
二维数的存储
先行后列,按行存储
ls[row][column]
先检索行后检索列 -
二维数据的处理
#读取CSV格式的文件
fo = open(fname)
ls = []
for line in fo:
line = line.replace("\n","")
ls.append(line.split(","))
fo.close()
#写入CSV格式的文件
ls = [[], [], []] #二维列表
f = open(fname, "w")
for item in ls:
f.write(",".join(item) + "\n")
f.close()
#逐一遍历
ls = [[1,2], [3,4], [5,6]]
for row in ls:
for column in row:
print(column)
词云库的使用
- 安装
pip install wordcloud
-基本使用方法
import wordcloud
c = wordcloud.WordCloud()
c.generate("wordcloud by Python")
c.to_file("pywordcloud.png")
举例
import wordcloud
txt = "life is short, you need python"
w = wordcloud.Wordcloud(\
background_color = "white")
w.generate(txt)
w.to_flie("xxx.png")
政府工作报告词云