Python操作ppt和pdf基础

PPT基本操作-增加幻灯片

当内容比较简洁时,使用Word编写内容比较单调,这时可以考虑使 用PPT编写内容,而Python如何操作PPT呢?

这时可以使用第3方库 python-pptx 来操作PPT

安装

pip install python-pptx 

常用方法与属性

# pip install python-pptx
def create_ppt():
    from pptx import Presentation
    # 创建ppt
    ppt = Presentation()
    # 增加幻灯片
    ppt.slides.add_slide(ppt.slide_layouts[0])
    ppt.slides.add_slide(ppt.slide_layouts[1])
    ppt.slides.add_slide(ppt.slide_layouts[3])
    ppt.slides.add_slide(ppt.slide_layouts[6])
    # 保存
    ppt.save('./create_data/01_创建PPT.pptx')


if __name__ == '__main__':
    create_ppt()

 PPT基本操作-增加内容

常用方法与属性

from pptx import Presentation
from pptx.util import Pt
def create_info():
    # 创建一个ppt
    ppt = Presentation()
    # 添加内容
    # 增加第1个页面
    slide = ppt.slides.add_slide(ppt.slide_layouts[1])
    # 获取标题
    title = slide.shapes.title
    title.text = 'This is Python Title'
    # 获取内容框
    content = slide.placeholders[1]
    content.text = 'Content Info'

    # 增加第2个页面
    slide2 = ppt.slides.add_slide(ppt.slide_layouts[1])
    # 获取内容占位框
    content2 = slide2.placeholders[1]
    # 获取内容frame框对象
    tf = content2.text_frame
    # 增加段落内容
    par = tf.add_paragraph()
    # 设置段落内容
    par.text = '1级内容'
    # 设置内容等级
    par.level = 1
    par2 = tf.add_paragraph()
    par2.text = '2级内容'
    par2.level = 2

    par3 = tf.add_paragraph()
    par3.text = '3级内容'
    par3.level = 3


    # 增加第3个页面
    slide3 = ppt.slides.add_slide(ppt.slide_layouts[6])
    left = top = right = bottom = Pt(200)
    # 增加文本框
    tb = slide3.shapes.add_textbox(left,top,right,bottom)
    # 增加内容
    tf4 = tb.text_frame
    par4 = tf4.add_paragraph()
    par4.text = '1级内容'
    par4.font.bold = True
    par4.font.size = Pt(30)

    # 保存ppt
    ppt.save('./create_data/02_增加内容.pptx')



if __name__ =='__main__':
    create_info()

PPT增加图片

 

from pptx import Presentation
from pptx.util import Pt
from pptx.enum.shapes import  MSO_AUTO_SHAPE_TYPE
def add_pic():

    # 创建一个ppt文档
    ppt = Presentation()
    # 建立一个幻灯片
    slide = ppt.slides.add_slide(ppt.slide_layouts[1])
    shapes = slide.shapes
    # 增加图片
    '''
    TypeError: _BaseGroupShapes.add_picture() missing 2 required positional arguments: 'left' and 'top'
    '''
    num = Pt(30)
    shapes.add_picture('./base_data/backg.jpg',num,num)

    # 建立第2个幻灯片
    slide2 = ppt.slides.add_slide(ppt.slide_layouts[1])
    shapes2 = slide2.shapes

    shapes2.add_picture('./base_data/backg.jpg',num,num,Pt(300))
    # 保存ppt文档
    ppt.save('./create_data/03_增加图片.pptx')

if __name__ == '__main__':
    add_pic()

PPT增加流程图 

from pptx import Presentation
from pptx.enum.shapes import MSO_AUTO_SHAPE_TYPE
from pptx.util import Pt

def create_shape():
    # 创建PPT文件
    ppt = Presentation()
    # 创建一个幻灯片
    slide = ppt.slides.add_slide(ppt.slide_layouts[5])
    # 获取形状对象
    shapes = slide.shapes
    shapes.title.text= '流程图'
    # 增加图形
    '''
    TypeError: _BaseGroupShapes.add_shape() missing 4 required positional arguments: 'left', 'top', 'width', and 'height'
    '''
    left = Pt(100)
    top = Pt(200)
    width = Pt(100)
    height = Pt(30)

    tmp_shape = shapes.add_shape(MSO_AUTO_SHAPE_TYPE.PENTAGON,left,top,width,height)
    tmp_shape.text = '第1步'

    for i in range(2,5):
        left =  left + width -Pt(10)
        ts = shapes.add_shape(MSO_AUTO_SHAPE_TYPE.CHEVRON,left,top,width,height)
        frame = ts.text_frame
        frame.text = f'第{i}步'
        frame.fit_text(max_size = 10,bold = True,italic = True)

    # 保存PPT文件
    ppt.save('./create_data/04_增加图形.pptx')


if __name__ == '__main__':
    create_shape()

 PPT增加图表

常用方法与属性

from pptx import Presentation
from pptx.chart.data import CategoryChartData
from pptx.enum.chart import XL_CHART_TYPE
from pptx.util import Pt
def use_chart():
    # 创建给我和PPT
    ppt = Presentation()
    # 增加一个页面
    slide = ppt.slides.add_slide(ppt.slide_layouts[6])
    # 设置图表
    # 设置图表的数据
    chart_data = CategoryChartData()
    # 设置分组
    chart_data.categories = ['第一季度','第二季度','第三季度','第四季度']
    # 设置数据
    chart_data.add_series('series',(19,21,16,30))
    # 将图表增到页面中
    '''
    TypeError: _BaseGroupShapes.add_chart() missing 5 required positional arguments: 'x', 'y', 'cx', 'cy', and 'chart_data'
    '''
    slide.shapes.add_chart(XL_CHART_TYPE.COLUMN_CLUSTERED,Pt(100),Pt(100),Pt(500),Pt(350),chart_data)
    # 保存PPT
    ppt.save('./create_data/05_增加图表.pptx')

def use_chart2():
    # 创建给我和PPT
    ppt = Presentation()
    # 增加一个页面
    slide = ppt.slides.add_slide(ppt.slide_layouts[6])
    # 设置图表
    # 设置图表的数据
    chart_data = CategoryChartData()
    # 设置分组
    chart_data.categories = ['第一季度','第二季度','第三季度','第四季度']
    # 设置数据
    chart_data.add_series('series',(19,21,16,30))
    chart_data.add_series('series',(22,23,15,25))
    chart_data.add_series('series',(20,19,19,28))
    # 将图表增到页面中
    '''
    TypeError: _BaseGroupShapes.add_chart() missing 5 required positional arguments: 'x', 'y', 'cx', 'cy', and 'chart_data'
    '''
    slide.shapes.add_chart(XL_CHART_TYPE.COLUMN_CLUSTERED,Pt(100),Pt(100),Pt(500),Pt(350),chart_data)
    # 保存PPT
    ppt.save('./create_data/05_增加图表.pptx')

if __name__ == "__main__":
    # use_chart()
    use_chart2()

 PPT设置图表样式

常用方法与属性

from pptx import Presentation
from pptx.chart.data import CategoryChartData
from pptx.enum.chart import XL_CHART_TYPE
from pptx.util import Pt
from pptx.enum.chart import XL_DATA_LABEL_POSITION,XL_LEGEND_POSITION

def use_chart():
    # 创建给我和PPT
    ppt = Presentation()
    # 增加一个页面
    slide = ppt.slides.add_slide(ppt.slide_layouts[6])
    # 设置图表
    # 设置图表的数据
    chart_data = CategoryChartData()
    # 设置分组
    chart_data.categories = ['第一季度','第二季度','第三季度','第四季度']
    # 设置数据
    chart_data.add_series('分组1',(19,21,16,30))
    chart_data.add_series('分组2',(22,23,15,25))
    chart_data.add_series('分组3',(20,19,19,28))
    # 将图表增到页面中
    chart = slide.shapes.add_chart(XL_CHART_TYPE.COLUMN_CLUSTERED,Pt(100),Pt(100),Pt(500),Pt(350),chart_data).chart

    # 设置图表的主题 1-48
    chart.chart_style= 10
    # 设置字体大小
    chart.font.size = Pt(10)

    # 获取分类轴的对象
    category =  chart.category_axis
    # 设置分类字体大小
    category.tick_labels.font.size = Pt(20)
    # 设置分类线
    category.has_major_gridlines = True

    # 设置标签对象
    plot = chart.plots[0]
    plot.has_data_labels = True
    plot.data_labels.position = XL_DATA_LABEL_POSITION.INSIDE_END

    # 增加图例
    chart.has_legend = True
    chart.legend.font.size = Pt(15)
    # 设置图例位置
    chart.legend.position =XL_LEGEND_POSITION.TOP
    chart.legend.include_in_layout = True

    # 保存PPT
    ppt.save('./create_data/06_设置图表.pptx')

if __name__ == "__main__":
    use_chart()

PPT绘制其它图表 

from pptx import Presentation
from pptx.chart.data import CategoryChartData
from pptx.enum.chart import XL_CHART_TYPE,XL_DATA_LABEL_POSITION
from pptx.util import Pt

def create_line():
    # 创建新的ppt文档
    ppt = Presentation()
    # 增加新的幻灯片
    slide = ppt.slides.add_slide(ppt.slide_layouts[6])
    # 创建图表数据对象
    chart_data = CategoryChartData()
    # 设置图表分类
    chart_data.categories=['第一季度','第二季度','第三季度','第四季度']
    # 设置数据
    chart_data.add_series('销售1组',(15,20,16,30))
    chart_data.add_series('销售2组',(17,21,15,28))
    chart_data.add_series('销售3组',(16,24,12,25))
    # 增加图表
    slide.shapes.add_chart(XL_CHART_TYPE.LINE,Pt(50),Pt(100),Pt(500),Pt(350),chart_data)
    # 保存ppt
    ppt.save('./create_data/07_折线图.pptx')
def create_pie():
    # 创建新的ppt文档
    ppt = Presentation()
    # 增加新的幻灯片
    slide = ppt.slides.add_slide(ppt.slide_layouts[6])
    # 创建图表数据对象
    chart_data = CategoryChartData()
    # 设置图表分类
    chart_data.categories=['第一季度','第二季度','第三季度','第四季度']
    # 设置数据
    chart_data.add_series('季度销量比例',(0.27,0.25,0.31,0.19))
    # 增加图表
    chart = slide.shapes.add_chart(XL_CHART_TYPE.PIE,Pt(50),Pt(100),Pt(500),Pt(350),chart_data).chart

    # 显示图例
    chart.has_legend =True
    # 显示标签
    chart.plots[0].has_data_labels =True
    # 设置数字显示方式
    data_labes = chart.plots[0].data_labels
    data_labes.number_format =  '0%'
    data_labes.position = XL_DATA_LABEL_POSITION.OUTSIDE_END
    # 保存ppt
    ppt.save('./create_data/07_饼图.pptx')


if __name__ == '__main__':
    # create_line()
    create_pie()

PDF读取内容 

安装

pip install pypdf2

pip install pdfplumber 

常用方法与属性 

#pip install pypdf2
from PyPDF2 import PdfFileReader
def read_pdf1():
    # 打开文件
    with open('./base_data/10_word转换成pdf.pdf','rb') as f:
        # 将打开的文件传递给Reader对象
        reader = PdfFileReader(f)
        # 获取页面的总页数
        number = reader.getNumPages()
        print(number)
        # 获取单页
        page = reader.getPage(0)
        # 提取文本
        info = page.extractText()
        print(info)

# pip install pdfplumber
def read_pdf2():
    import pdfplumber
    # 打开文件
    with pdfplumber.open('./base_data/10_word转换成pdf.pdf') as f:
        # 获取数据
        print(f.pages)
        for p in f.pages:
            print(p.extract_text())
            
if __name__ =='__main__':
    # read_pdf1()
    read_pdf2()

 PDF合并文件

在工作时,有时会碰到多个同类型内容的PDF文件,页码数又少, 一个一个的打开又比较麻烦。这时应该如何处理呢? 这时就需要一个合并PDF的操作,而合并PDF操作的思路是: 读取源PDF文件 ,写入到一个新的PDF文件中 

def merger_file(*m_path):
    from PyPDF2 import PdfFileReader,PdfFileWriter
    # 创建一个写入的对象
    writer = PdfFileWriter()
    # 读数据
    for path in m_path:
        # 创建reader
        reader = PdfFileReader(open(path,'rb'))
        # 读取页面数据
        for p in reader.pages:
            # 写新的pdf
            writer.addPage(p)
    # 保存
    with open('./create_data/02_合并pdf.pdf','wb') as f:
        writer.write(f)

if __name__ =='__main__':
    path = r'.\base_data\10_word转换成pdf.pdf'
    merger_file(path,path,path)

 PDF拆分文件

在工作时,有时会碰到一个比较大的PDF的文件,页码数比较多。 而我们又想将数据进行分割,又如何处理呢? 这时就需要一个操作拆分PDF,而拆分PDF的操作的思路是: 读取源PDF文件 写入到一个新的PDF文件中

from PyPDF2 import PdfFileReader,PdfFileWriter
def chai_pdf(path):
    # 读取文件
    reader = PdfFileReader(open(path,'rb'))
    # 获取页面数据
    for i,p in enumerate(reader.pages):
        writer = PdfFileWriter()
        writer.addPage(p)
        # 保存新pdf文件
        with open(f'./create_data/03_拆分pdf_{i}.pdf','wb') as f:
            writer.write(f)

if __name__ =='__main__':
    path = './create_data/02_合并pdf.pdf'
    chai_pdf(path)

PDF加密文件

from asyncore import write
from PyPDF2 import PdfFileReader,PdfFileWriter
def jia_mi(path):
    # 读取数据
    reader = PdfFileReader(open(path,'rb'))
    # 创建写Pdf的对象
    writer = PdfFileWriter()
    # 写入密码
    writer.encrypt('123')
    # 把内容复制pdf的writer中
    for p in reader.pages:
        writer.addPage(p)
    # 保存数据
    with open('./create_data/04_加密pdf.pdf','wb') as f:
        writer.write(f)
if __name__ =='__main__':
    path = r'base_data\10_word转换成pdf.pdf'
    jia_mi(path)

茯茶中的“金花”是一种有益菌,生物学家现定名为“冠突散囊菌”,是国家二级机密保护菌种,在自然界只有千年灵芝才有。如同奶酪中的乳酸菌。其消食健胃,杀腥解腻,降脂减肥,降压降糖,生津御寒的饮用功能为其他茶类所不及,特别是对主食肉类、缺少蔬菜、水果的人们,长期饮用茯茶既能补充人体所需的维生素和矿物质,又能消食化滞、和胃润肠、通便利尿、调节人体新陈代谢,对人体起着一定的保健和病例预防作用。尽管茯茶性温,有消食利水、补气之效。 [8] 

泾阳茯砖茶的保健功效很多,主要有以下几个方面:

1、补充膳食营养

茯砖茶营养成分丰富,含有维生素、矿物质、蛋白质、氨基酸、茶多糖等物质,对主食肉、奶酪,饮食缺少蔬菜、水果的西北地区居民而言,长期饮用,可补充以上物质,故而有“生命之茶”之说。

2、消食健胃

茯砖茶中的咖啡碱、维生素、氨基酸等有助于人体消化,调节新陈代谢,特别适合老年人喝。

3、茶多糖降血糖

茶多糖的口感为甜纯,存放陈化多年的老黑茶茶品越泡越甜,均与茶多糖含量有关。茶多糖通过抗氧化作用和增强葡萄糖激酶的活性来有效降低血糖。肾上腺素、甲状腺素和胰高血糖素等都可使血糖升高,并加速肝糖原的分解,而能使血糖下降的只有胰岛素,所以茶多糖的降血糖作用与其保护和刺激胰岛素细胞的分泌活动有关。

4、降血压

茯砖茶中特有的氨基酸、茶氨酸能通过活化多巴胺酶神经元,起到抑制血压升高的作用。茶色素具有显著的抗血衰,促进纤溶,防止血小板黏附聚集,抑制动脉平滑肌细胞增生的作用。

5、茶多糖抗血凝、抗血栓作用

茶多糖在体内、体外均有显著的抗血凝作用,并减少血小板数,延长血凝从而影响血栓的形成。另外,茶多糖能提高纤维蛋白溶解的活力,由此可见,茶多糖可作用于血栓形成的所有环节。茶多糖还具有防辐射、抗肿瘤、抗病毒、降血压、耐缺氧及增加冠状动脉血流量等多种生物学功能。此外,茯茶中的茶多糖、茶多酚具有抗辐射的作用,对长期看电视或操作电脑的人十分有益。

  • 1
    点赞
  • 18
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
随着国家大数据战略的深入实施,各行业智慧化建设急需数据分析人才和智能应用人才。智慧化简单来说是一个以机器替换人力的过程,而机器的“灵魂”是程序。Python已经成为公认的驱动大数据智能应用的主流编程语言。Python程序设计的书籍已经琳琅满目,每一本书都凝聚了作者对Python的理解和对程序设计的认识,都是作者编程开发和教学经验的总结,都折射出作者的专业背景。由于大数据专业学生对程序设计的要求不是很高,但又需要具备一定的计算思维能力,熟悉用程序进行数据分析的一般流程,因此程序设计教材要言不甚深、文不甚俗,既要覆盖相关技术,又不能面面俱到,注重对问题的分析和解释,用程序表达算法。鉴于此,我们编写了本书。 本书每一章的标题都以Python开头,凸显Python在各个部分都有其独特的编程理念和方法。与其他高级编程语言如C、C++和Java等相比,Python在数据的表示、处理和可视化方面都有绝对的优势。有编程基础的学习者在学习Python时最好能忘掉以往程序设计语言的语法,彻底转变观念,以全新的姿态融入到Python的编程特点和规律之中。如变量定义、数据类型、数据结构、控制结构、类和对象、文件访问、数据分析和可视化,每一部分都有其特别之处,都值得我们重新认识,重新使用,重新熟悉。每一章开始的思维导图都是对本章技术脉络的梳理,开门见山地给学习者展示本章的知识和技术体系,以便学习者在学习过程中始终能保持思路清晰和整体把握。每一章开头的本章导读都是编者多年来程序开发与设计教学经验的提炼与升华,都是对程序设计的理解和感悟,值得学习者深入领会。每一章开头的本章要点都是要求学习者深入理解的重要知识和熟练掌握的关键技术。每一章的小结都是对本章要点的具体解释,供学习者复习查询。 本书为河北省高等教育教学改革研究与实践项目“新工科背景下警务大数据应用专业人才培养模式与教学实践研究”(编号:2018GJJG450)的阶段性成果。 下面是本书的体系结构图。 第1章Python编程初步。学习本章,要了解Python作为一种计算机程序设计脚本语言,结合了解释性、编译性和互动性的特点;了解在Linux和Windows中安装Python的方法;了解IDLE、PyCharm和Jupyter三种常用Python程序编辑环境。工欲善其事,必先利其器,通过对本章的学习,学习者可拥有一个强大的编程工具,从此开启数据分析编程之旅。 第2章Python语言基础Python作为一门与计算机交流的编程语言,有着跟自然语言相似的特点:字、词、句、段落、篇章,以及相应的行文语法规则。学习本章,要理解程序行文的字词句,主要包括基本数据类型、常量和变量、运算符和表达式;理解程序的段落和篇章,主要包括常用内置函数、库函数和系统函数的使用;掌握程序的语法规则,主要包括常用的变量定义和标识符命名规则、语句组织成文编码规则等。这些都是程序设计的基础,学习者只有对此熟练掌握后,才能在后续的学习中得心应手。 第3章Python组合数据类型。组合数据类型是Python语言区别于其他高级编程语言的一大特色,通过组合数据类型,省去了其他语言各种复杂数据结构的设计,给编程人员带来了极大的方便,这也是Python流行于数据分析领域的原因之一。学习本章,要熟练掌握Python组合数据类型(列表、元组、字符串、字典、集合)的创建、访问和常见基本操作,以及序列解包功能。 第4章 Python控制结构。针对物质随时间由简单向复杂、由低级向高级发展的顺序,Python语言有相应的顺序结构语句;针对物质运动发展的条件性,Python语言有相应的选择结构语句;针对物质运动的波浪式前进螺旋式上升规律,Python语言有相应的循环结构语句。学习本章,要从马克思主义自然哲学视角理解Python语言在描述物质运动规律时的表达方式;掌握用Python语言描述常用算法,解决一些基本问题的方式。 第5章 Python函数与模块。有些经常用到的能实现特定功能的代码块,我们总是不希望每次用到时都重写一遍,甚至不希望复制一遍,但又想重复使用。Python里这些经常重用的代码块以函数(Function)的形式被定义,每一次复用被称为函数调用,计算机依然要执行重用的代码。学习本章,要理解函数的概念,掌握定义函数的方法,深刻理解函数调用中参数的传递(值传递、地址传递),理解变量的作用域(变量的作用范围或变量的生命周期),理解函数集合模块、包等概念,掌握模块和包的创建及使用方法。 第6章 Python面向对象程序设计。面向过程的程序设计方法难以保证程序的安全性和代码的可重用性,而面向对象的程序设计方法能够更好地提高大型程序的质量和开发效率,增强程序的安全性和提高代码的可重用性。学习本章,重在理解面向对象程序设计思想、类和对象的概念

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

艾派森

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值