Python3笔记 001 字典的get、列表的sort、jieba

1.对字符串的归一化处理(即替换异常字符)可以用字符串的replace方法

2.对字典的更新处理可以用字典的get方法实现

a[b] = a.get(b,0) +1 # 新增键值对

3.列表的sort函数:

key参数:

传入一个函数,此函数将作用于每一个元素,得到新的序列,根据新的序列从小到大

当不传入参数时,默认为None。  如果为可迭代对象,不传入参数,也可以排序,如何实现的?(可能是根据每个元素的第一域比较的)

如果key函数为operator.itemgetter函数,可进行多重比较,即在第一重比较值相同的情况下根据第二域比较。(

operator模块提供的itemgetter函数用于获取对象的哪些维的数据,参数为一些序号(即需要获取的数据在对象中的序号),下面看例子。

a = [1,2,3] 
>>> b=operator.itemgetter(1)      //定义函数b,获取对象的第1个域的值
>>> b(a) 

>>> b=operator.itemgetter(1,0)   //定义函数b,获取对象的第1个域和第0个的值
>>> b(a) 
(2, 1) 

要注意,operator.itemgetter函数获取的不是值,而是定义了一个函数,通过该函数作用到对象上才能获取值。

reverse = False 升序(默认)

4.元组可直接对两个变量赋值。

5.词频统计中用len()==1 排除‘是’,标点符号之类的无实际意义的助词。

6.win10系统记事本保存的是ansi编码,打开文件选择编码时要注意,也可以添加errors="ignore"参数忽略错误。

7.win10cmd使用gb2312编码,在解码时注意。

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值