Python第六周第七周

集合
多个元素放在一起,不存在相同元素,没有顺序。
放入集合的元素是不可变的元素类型。
整数、浮点数、复数、字符串类型
用{}表示
元素之间用 , 分隔
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
集合操作:
在这里插入图片描述
在这里插入图片描述
集合是存储时候是无序的
集合比较 >= 之类的
集合去重:
在这里插入图片描述


序列类型和操作

在这里插入图片描述
在这里插入图片描述
序列类型通用操作符:
在这里插入图片描述

在这里插入图片描述
元组类型定义
在这里插入图片描述
在这里插入图片描述
列表类型定义:
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
序列类型的运用场景
1.数据表示
在这里插入图片描述
元素遍历:
for item in ls:
<语句块>
for item in tp:
<语句块>
2.数据保护
在这里插入图片描述
3.基本统计值
在这里插入图片描述


字典类型及操作
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
集合使用set{}生成 无键值对
字典使用 {}生成 有键值对

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
字典类型的应用场景:
映射的表达
在这里插入图片描述
在这里插入图片描述


jieba库的使用
优秀的中文分词第三方库
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述


文本词频统计

中文:
import jieba
excludes={"将军","却说","荆州","二人","不可","不能","如此"}
txt=open("threekingdoms.txt","r",encoding="utf-8").read()
words=jieba.lcut(txt)
counts={}
for word in words:#多了个小盒子 rword
    if len(word)==1:
        continue
    elif word=="诸葛亮" or word=="孔明曰":
        rword="孔明"
    elif word == "关公" or word == "云长":
        rword = "关羽"
    elif word == "玄德" or word == "玄德曰":
        rword = "刘备"
    elif word == "孟德" or word == "丞相":
        rword = "曹操"
    else:
        rword=word
    counts[rword]=counts.get(rword,0)+1

for word in excludes:
    del counts[word]
items=list(counts.items())
items.sort(key=lambda x:x[1],reverse=True)
for i in range(10):
    word,count=items[i]
    print("{0:<10}{1:>5}".format(word,count))


文件的使用
有的文件是文本文件 有的是二进制文件
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
文本文件保存:

#文本形式打开文件
tf = open("f.txt","rt")
print(tf.readline())
tf.close()

放在同一个目录中

#二进制形式打开文件
bf=open("f.txt","rb")
print(bf.readline())
bf.close()

**在这里插入图片描述**
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述


文件内容的读取
在这里插入图片描述
在这里插入图片描述
遍历全文本方法二:分阶段 按数量逐步处理
在这里插入图片描述
逐行处理:
方法一:
在这里插入图片描述
在这里插入图片描述


数据的文件写入
在这里插入图片描述写入时候 没有空格 没有换行
在这里插入图片描述

在这里插入图片描述


自动轨迹绘制实例:
根据脚本来绘制图形
不是根据代码
自动化的很重要的过程
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述


自动绘制实例

#AutoTraceDraw.py
import turtle as t
t.title("自动轨迹绘制")
t.setup(800,600,0,0)
t.pencolor("red")
t.pensize(5)
#数据读取
datels=[]
f=open("data.txt")
for line in f:
	line = line.replace("\n","")
	detals.append(list(map(eval,line.split(","))))
f.close()
	#map 内嵌函数 功能:降低一个函数的参数作用于第二个参数 eval 作用在 line.split
#自动绘制
for i in range(len(detals)):
	t.pencolor(detals[i][3],detals[i][4],detals[i][5])
	t.fd(detals[i][0]])
	if detals[i][1]:
		t.right(detals[i][2])
	else:
		t.left(detals[i][2])
	

数据:
在这里插入图片描述


举一反三:
在这里插入图片描述
在这里插入图片描述


数据维度
一维:在这里插入图片描述
二维:
在这里插入图片描述
多维:
在这里插入图片描述
在这里插入图片描述


在这里插入图片描述
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
通常采用这样的思路,虽然通用型较差


数据处理:
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述


二维数据的表达和处理
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述


词云
wordcloud库安装
(cmd命令行)pip install wordcloud
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述


工作报告词云

#GovRptWordCloudv1.py
import jieba
import wordcloud
f = open("新时代中国特色社会主义.txt", "r", encoding="utf-8")

t = f.read()
f.close()
ls = jieba.lcut(t)

txt = " ".join(ls)
w = wordcloud.WordCloud( \
    width = 1000, height = 700,\
    background_color = "white",\
font_path="/System/Library/fonts/PingFang.ttc"
    )
w.generate(txt)
w.to_file("grwordcloud.png")
#特别注意 mac系统下的字体 用我写的这个font_path

如果要词云有形状

import jieba
import wordcloud
from scipy.misc import  imread
mask = imread("fivestart.png")
f = open("关于实施乡村振兴战略的意见.txt", "r", encoding="utf-8")
t = f.read()
f.close()
ls = jieba.lcut(t)

txt = " ".join(ls)
w = wordcloud.WordCloud( \
    width = 1000, height = 700,\
    background_color = "white",\
font_path="/System/Library/fonts/PingFang.ttc",\
    mask=mask,\
    max_words=15
    )
w.generate(txt)
w.to_file("grwordcloud.png")
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值