字典类型
用{}或dict()创建,用冒号:表示
字典变量={<值1>:<值1>,<值2>:<值2>,<值n>:<值n>}
例如:
d={“中国”:“北京”,“美国”:“华盛顿”}
d[“中国”]
结果“北京”
创建一个空字典
de={};type(de)
del d[k] 删除字典d中键k对应的值
k in d 判断k时候在字典d中,返回true,false
d.keys() 返回字典d中所有键值 (前面名字)
d.values() 返回字典d中所有值信息 (后面内容)
d.items() 返回字典d中多有键值对信息
d.get(k,default) 键k存在,返回相应值 ,不在返回default
d.pop(k,default) 键k存在,取出相应值,不在返回default
d.popitem() 随机取出一个键值
d.cleat() 删除所有键值对
len(d) 返回字典d中元素个数
+++++++++++++++++++++++++++++++
jieba库
中文分词第三方库
精准模式,把文本精确的切分开,不存在冗余单词
全模式,把文本中所有可能的词语都扫描出来,有冗余
搜索引擎模式,在精准模式基础上,对长词再次切分
例如1精准模式
jieba.lcut(“中国是一个伟大的国家”)
结果:[‘中国’,‘是’,‘一个’,‘伟大’,‘的’,‘国家’]
例如2全模式
jieba.lcut(“中国是一个伟大的国家”,cut_all=true)
结果:[‘中国’,‘国是’,‘一个’,‘伟大’,‘的’,‘国家’]
例如3搜索引擎模式
jieba.lcut_for_search(“中华人民共和国是伟大的”)
结果:[‘中国’,‘华人’,‘人民’,‘共和’,‘共和国’,‘中华人民共和国’,‘是’,‘伟大’,‘的’]
例如:将词语加入库中
jieba.add_word(“py真好学”)