python第六周：字典，jieba库

最新推荐文章于 2023-09-28 21:08:45 发布

某在斯l

最新推荐文章于 2023-09-28 21:08:45 发布

阅读量807

点赞数

本文链接：https://blog.csdn.net/guo0704/article/details/81745425

版权

字典：

字典类型是“映射”的体现

键值对：键是数据索引的扩展

字典是键值对的集合，键值对之间无序，采用大括号{}和dict（）创建，键值对用冒号。表示为

{<键1>:<值1>,<键2>:<值2>, ... , <键n>:<值n>}

在字典变量中，通过键值获取值，如： <值> = <字典变量>[<键>]

>>> d = {"中国":"北京","美国":"华盛顿":"法国":"巴黎"}
>>> d["中国"] 
"北京"
>>> de = {} ; type(de)
<class 'dict'>#返回变量x的类型

字典类型操作函数和方法

del d[k]	删除字典d中键k对应的数据值
k in d	判断键k是否在字典d中，如果在返回True，否则返回false
d.keys()	返回字典d中所有键信息
d.values()	返回字典d中所有值的信息
d.items()	返回字典d中所有的键值对信息

jieba库是优秀的中午分词第三方库

cmd命令： pip install jieba

原理：利用了一个中文词库，确定汉字之间的关联概率

精确模式：把文本精确的分开，不存在冗余单词

全模式：把文本所有可能的词语扫描出来，有冗余

搜索引擎模式：在精确模式的基础上，对长词再次切分

常用函数

关注