defaultdict 应用
今天在研究数据挖掘那本书的时候看到了运用
defaultdict ,在这里简单记录一下自己的理解。
所谓的defaultdict,其实就是一个字典,而字典的基本格式为:键-值,这个函数的用法就是说不在范围内的键值会返回一个默认值,就是这么简单。看以下例子。
for word in wordlist:
if word in frequencies:
frequencies[word] += 1
else:
frequencies[word] = 1
if word in frequencies:
frequencies[word] += 1
else:
frequencies[word] = 1
等价于
from
collections
import
defaultdict
frequencies = defaultdict(int) # 传入int()函数来初始化
for word in wordlist:
frequencies[word] += 1
frequencies = defaultdict(int) # 传入int()函数来初始化
for word in wordlist:
frequencies[word] += 1
print格式化输出
一. %应用
1.整数输出
1 >>> print('%o' % 20) 2 24 3 >>> print('%d' % 20) 4 20 5 >>> print('%x' % 20) 6 14
2、浮点数输出
%f ——保留小数点后面六位有效数字
%.3f,保留3位小数位
%e ——保留小数点后面六位有效数字,指数形式输出
%.3e,保留3位小数位,使用科学计数法
%g ——在保证六位有效数字的前提下,使用小数方式,否则使用科学计数法
%.3g,保留3位有效数字,使用小数或科学计数法
1 >>> print('%f' % 1.11) # 默认保留6位小数 2 1.110000 3 >>> print('%.1f' % 1.11) # 取1位小数 4 1.1 5 >>> print('%e' % 1.11) # 默认6位小数,用科学计数法 6 1.110000e+00 7 >>> print('%.3e' % 1.11) # 取3位小数,用科学计数法 8 1.110e+00 9 >>> print('%g' % 1111.1111) # 默认6位有效数字 10 1111.11 11 >>> print('%.7g' % 1111.1111) # 取7位有效数字 12 1111.111 13 >>> print('%.2g' % 1111.1111) # 取2位有效数字,自动转换为科学计数法 14 1.1e+03
(2)内置round()
注:“.5”这个是一个“坑”,且python2和python3出来的接口有时候是不一样的,尽量避免使用round()函数吧
1 >>> round(1.1125) # 四舍五入,不指定位数,取整 2 1 3 >>> round(1.1135,3) # 取3位小数,由于3为奇数,则向下“舍” 4 1.113 5 >>> round(1.1125,3) # 取3位小数,由于2为偶数,则向上“入” 6 1.113 7 >>> round(1.5) # 无法理解,查阅一些资料是说python会对数据进行截断,没有深究 8 2 9 >>> round(2.5) # 无法理解 10 2 11 >>> round(1.675,2) # 无法理解 12 1.68 13 >>> round(2.675,2) # 无法理解 14 2.67 15 >>>
3、字符串输出
%s
%10s——右对齐,占位符10位
%-10s——左对齐,占位符10位
%.2s——截取2位字符串
%10.2s——10位占位符,截取两位字符串
1 >>> print('%s' % 'hello world') # 字符串输出 2 hello world 3 >>> print('%20s' % 'hello world') # 右对齐,取20位,不够则补位 4 hello world 5 >>> print('%-20s' % 'hello world') # 左对齐,取20位,不够则补位 6 hello world 7 >>> print('%.2s' % 'hello world') # 取2位 8 he 9 >>> print('%10.2s' % 'hello world') # 右对齐,取2位 10 he 11 >>> print('%-10.2s' % 'hello world') # 左对齐,取2位 12 he
二. format用法
相对基本格式化输出采用‘%’的方法,format()功能更强大,该函数把字符串当成一个模板,通过传入的参数进行格式化,并且使用大括号‘{}’作为特殊字符代替‘%’
使用方法由两种:b.format(a)和format(a,b)。
1、基本用法
(1)不带编号,即“{}”
(2)带数字编号,可调换顺序,即“{1}”、“{2}”
(3)带关键字,即“{a}”、“{tom}”
1 >>> print('{} {}'.format('hello','world')) # 不带字段 2 hello world 3 >>> print('{0} {1}'.format('hello','world')) # 带数字编号 4 hello world 5 >>> print('{0} {1} {0}'.format('hello','world')) # 打乱顺序 6 hello world hello 7 >>> print('{1} {1} {0}'.format('hello','world')) 8 world world hello 9 >>> print('{a} {tom} {a}'.format(tom='hello',a='world')) # 带关键字 10 world hello world
2、进阶用法
(1)< (默认)左对齐、> 右对齐、^ 中间对齐、= (只用于数字)在小数点后进行补齐
(2)取位数“{:4s}”、"{:.2f}"等
1 >>> print('{} and {}'.format('hello','world')) # 默认左对齐 2 hello and world 3 >>> print('{:10s} and {:>10s}'.format('hello','world')) # 取10位左对齐,取10位右对齐 4 hello and world 5 >>> print('{:^10s} and {:^10s}'.format('hello','world')) # 取10位中间对齐 6 hello and world 7 >>> print('{} is {:.2f}'.format(1.123,1.123)) # 取2位小数 8 1.123 is 1.12 9 >>> print('{0} is {0:>10.2f}'.format(1.123)) # 取2位小数,右对齐,取10位 10 1.123 is 1.12
3、多个格式化
'b' - 二进制。将数字以2为基数进行输出。
'c' - 字符。在打印之前将整数转换成对应的Unicode字符串。
'd' - 十进制整数。将数字以10为基数进行输出。
'o' - 八进制。将数字以8为基数进行输出。
'x' - 十六进制。将数字以16为基数进行输出,9以上的位数用小写字母。
'e' - 幂符号。用科学计数法打印数字。用'e'表示幂。
'g' - 一般格式。将数值以fixed-point格式输出。当数值特别大的时候,用幂形式打印。
'n' - 数字。当值为整数时和'd'相同,值为浮点数时和'g'相同。不同的是它会根据区域设置插入数字分隔符。
'%' - 百分数。将数值乘以100然后以fixed-point('f')格式打印,值后面会有一个百分号。
1 >>> print('{0:b}'.format(3)) 2 11 3 >>> print('{:c}'.format(20)) 4 5 >>> print('{:d}'.format(20)) 6 20 7 >>> print('{:o}'.format(20)) 8 24 9 >>> print('{:x}'.format(20)) 10 14 11 >>> print('{:e}'.format(20)) 12 2.000000e+01 13 >>> print('{:g}'.format(20.1)) 14 20.1 15 >>> print('{:f}'.format(20)) 16 20.000000 17 >>> print('{:n}'.format(20)) 18 20 19 >>> print('{:%}'.format(20)) 20 2000.000000% 21 >>>