python数据格式化之pprint

pprint – 美观打印

作用:美观打印数据结构

pprint 包含一个“美观打印机”,用于生成数据结构的一个美观视图。格式化工具会生成数据结构的一些表示,不仅可以由解释器正确地解析,而且便于人类阅读。输出尽可能放在一行上,分解为多行时则需要缩进。

以下实例用用到的data包含一下数据

data = [(1,{'a':'A','b':'B','c':'C','d':'D'}),

        (2,{'e':'E','f':'F','g':'G','h':'H',

            'i':'I','j':'J','k':'K','l':'L'

            }),

        ]

1、  打印

要使用这个模块,最简单的方法就是利用pprint()函数 

1

2

3

4

5

6

from pprint import pprint

print 'PRINT:'

print data

print 

print 'PPRINT:'

pprint(data)

运行结果:

1

2

3

4

5

6

7

8

9

10

11

12

13

PRINT:

[(1, {'a''A''c''C''b''B''d''D'}), (2, {'e''E''g''G''f''F''i''I''h''H''k''K''j''J''l''L'})]

PPRINT:

[(1, {'a''A''b''B''c''C''d''D'}),

 (2,

  {'e''E',

   'f''F',

   'g''G',

   'h''H',

   'i''I',

   'j''J',

   'k''K',

   'l''L'})]

pprint()格式化一个对象,并把它写至一个数据流,这个数据流作为参数传入(或者是默认的sys.stdout)

注意为什么第二个字典中会显示一竖列,因为pprint打印支持8个对象以上的竖列打印

 

2、  格式化

格式化一个数据结构而不把它直接写至一个流(例如用于日志记录),可以使用pformat()来构造一个字符串表示。 

1

2

3

4

5

6

7

8

9

import logging

from pprint import pformat

logging.basicConfig(level = logging.DEBUG,

                    format = '%(levelname)-8s %(message)s',

                    )

logging.debug('Logging pformatted data')

formatted = pformat(data)

for line in formatted.splitlines():

    logging.debug(line.rstrip())

运行结果:

1

2

3

4

5

6

7

8

9

10

11

DEBUG    Logging pformatted data

DEBUG    [(1, {'a''A''b''B''c''C''d''D'}),

DEBUG     (2,

DEBUG      {'e''E',

DEBUG       'f''F',

DEBUG       'g''G',

DEBUG       'h''H',

DEBUG       'i''I',

DEBUG       'j''J',

DEBUG       'k''K',

DEBUG       'l''L'})]

然后可以单独低打印格式化的字符串或者计入日志

splitlines() 按行分割()

rstrip()去除右边的空格 lstrip()去除左边的空格 strip()去除两边空格。默认为去除空格,也可以传入需要从两边或者其中一边去除的字符,如strip(‘a’)就是去除字符串两边的字符’a’

3、  任意类

如果定制类定义了一个__repr__()方法,pprint()使用的PrettyPrinter类还可以处理这些定制类。

1

2

3

4

5

6

7

8

9

10

11

12

13

14

from pprint import pprint 

class node(object):

    def __init__(self,name,contents =[]):

        self.name = name

        self.contents = contents[:]

    def __repr__(self):

        return ('node(' + repr(self.name) + ',' +

                repr(self.contents) + ')'

                )

trees = [node('node-1'),

         node('node-2',[node('node-2-1')]),

         node('node-3',[node('node-3-1')]),         

         ]

pprint(trees)

运行结果:

1

2

3

[node('node-1',[]),

 node('node-2',[node('node-2-1',[])]),

 node('node-3',[node('node-3-1',[])])]

由PrettyPrinter组合嵌套对象的表示,从而返回完整字符串表示。

 4、  递归

递归数据结构有指向原数据源的引用来表示,形式为<Recursion on typename with id=number>。 

1

2

3

4

5

6

from pprint import pprint 

local_data = ['a','b',1,2]

local_data.append(local_data)

print 'id(local_data) =>',id(local_data)

pprint(local_data)

print local_data

运行结果:

1

2

3

id(local_data) =47458332363520

['a''b'12, <Recursion on list with id=47458332363520>]

['a''b'12, [...]]

在这个例子中,列表local_data增加到了其自身,这会创建一个递归引用

内置函数id()作用是获得对象的id值,理论上讲每个对象都有一个id值,如果是整数和字符串((相对较小的时候)),那么相同的值会有相同的id值,但是如果是类,及时相同也会有不同的id值。测试如下: 

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

32

33

34

35

36

37

38

39

#int or float or lon 都一样(比较小的时候)

= 65464131311513l

= 65464131311513l

= 65464131311513l

print id(a)

print id(b)

print id(c)

print

= '12312312'

= '12312312'

= '12312312'

print id(a)

print id(b)

print id(c)

print 

= 65464131311513l*11

= 65464131311513l*11

= 65464131311513l*11

print id(a)

print id(b)

print id(c)

print

= '12312312'*11

= '12312312'*11

= '12312312'*11

print id(a)

print id(b)

print id(c)

print 

class Test(object):

    def __init__(self):

        pass

= Test()

= Test()

= Test()

print id(a)

print id(b)

print id(c)

print

测试结果:

47010342174992

47010342174992

47010342174992

 

47010343272096

47010343272096

47010343272096

 

47010343261568

47010343261648

47010343261688

 

47010343200944

47010343199152

47010343202352

 

47010343252304

47010343252944

47010343253008

5、  限制嵌套输出

对于非常深的数据结构,可能不要求输出包含所有细节。有可能数据没有是当地格式化,也可能格式化文本过大而无法管理,或者默写数据时多余的。 

1

2

3

4

5

6

7

8

9

from pprint import pprint 

print 'depth 1 :'

pprint(data,depth=1)

print 

print 'depth 2 :'

pprint(data,depth=2)

print 

print 'depth 3 :'

pprint(data,depth=3)

运行结果:

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

depth 1 :

[(...), (...)]

depth 2 :

[(1, {...}), (2, {...})]

depth 3 :

[(1, {'a''A''b''B''c''C''d''D'}),

 (2,

  {'e''E',

   'f''F',

   'g''G',

   'h''H',

   'i''I',

   'j''J',

   'k''K',

   'l''L'})]

使用depth参数可以控制美观打印机递归处理嵌套数据结构的深度。输出中未包含的层次由一个省略号表示 

6、  控制输出宽度

格式化文本的默认输出宽度为80列。要调整这个宽度,可以再pprint()中使用参数width。 

1

2

3

4

5

from pprint import pprint

for width in [80,5]:

    print 'WIDTH = ', width

    pprint(data,width = width)

    print

运行结果:

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

WIDTH =  80

[(1, {'a''A''b''B''c''C''d''D'}),

 (2,

  {'e''E',

   'f''F',

   'g''G',

   'h''H',

   'i''I',

   'j''J',

   'k''K',

   'l''L'})]

WIDTH =  5

[(1,

  {'a''A',

   'b''B',

   'c''C',

   'd''D'}),

 (2,

  {'e''E',

   'f''F',

   'g''G',

   'h''H',

   'i''I',

   'j''J',

   'k''K',

   'l''L'})]

宽度大小不能适应格式化数据结构时,如果斩断或转行会引入非法的语法,就不会进行截断或转行。

 

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

「已注销」

LHStudio感谢您的支持

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值