Python数据分析之Excel

28 篇文章 0 订阅
20 篇文章 0 订阅


1、Openpyxl模块

Openpyxl是一个用于处理xlsx格式Excel表格文件的第三方python库,几乎支持Excel表格的所有操作

基本概念:

  • Workbook:相当于一个Excel文档,每个Workbook对象都是一个独立的Excel文件
  • Sheet:Excel文档中的表单,每个Excel文档中至少有一个Sheet
  • Cell:Excel单元格,是不可分割的基本数据存储单元

安装:

pip install openpyxl

2、Excel写入

2.1、新建

from openpyxl import load_workbook, Workbook

# 新建一个Excel文档(初始化)
workbook = Workbook()
# 初始化/获取一个Sheet(新创建的Excel默认自带名为Sheet的表单)
# sheet = workbook.active
# 创建一个Sheet,新建的多个Sheet默认插在后面
sheet = workbook.create_sheet("Sheet1")
# 创建一个Sheet,插入到最前面
# sheet = workbook.create_sheet("Sheet1", 0)

2.2、添加数据

'''
append(list):在已有的数据后面追加写入(增量写入)
'''
# 定义表头(插入一条数据)
sheet.append(['id', 'name', 'age', 'addr'])
# 批量插入数据
data = [
    ['001', 'Tom', 18],
    ['002', 'Jerry', 17, 'US'],
    ['003', 'Alice', 20]
]
for row in data:
    sheet.append(row)

# 保存Excel-Sheet1
workbook.save(r'C:\Users\cc\Desktop\openpyxl.xlsx')

2.3、单元格格式

from openpyxl.styles import Font, Border, Side, PatternFill, colors, Alignment

# 1)字体
# 设置A1单元格字体风格为Times New Roman,大小16,粗体、斜体,蓝色
sheet['A1'].font = Font(name='Times New Roman', size=16, bold=True, italic=True, color=colors.BLUE)

# 2)对齐方式
# 设置单元格horizontal水平和vertical垂直对齐方式,其他值:left、right
sheet['A1'].alignment = Alignment(horizontal='center', vertical='center')

# 3)行高和列宽
# 设置行高
sheet.row_dimensions[1].height = 25
# 设置列宽
sheet.column_dimensions['A'].width = 15

# 4)边框
# 设置边框四个方向的线条种类
left, right, top, bottom = [Side(style='thin', color='000000')] * 4
# 将各方向线条作为参数传入Border方法
sheet['A1'].border = Border(left=left, right=right, top=top, bottom=bottom)

# 5)合并、拆分单元格
# 合并单元格
sheet.merge_cells('A1:B2')
# 拆分单元格
sheet.unmerge_cells('A1:B2')

# 保存Excel-Sheet2
workbook.save(r'C:\Users\cc\Desktop\openpyxl.xlsx')

3、Excel读取

'''
load_workbook(Excel):文件必须是xlsx格式,默认为可读可写
'''
workbook = load_workbook(r'C:\Users\cc\Desktop\openpyxl.xlsx')
# 读取指定Sheet
sheet = workbook.get_sheet_by_name('Sheet1')

# 追加一条记录
sheet.append(['004', 'Bob', 19, 'CN'])

# 保存Excel
workbook.save(r'C:\Users\cc\Desktop\openpyxl.xlsx')

4、Excel的CRUD

添加数据见2.2节

4.1、查

# 获取所有Sheet表名,返回List
print(workbook.sheetnames)     # ['Sheet', 'Sheet1']

# 最大行数
print(sheet.max_row)
# 最大列数
print(sheet.max_column)

# 单元格访问
print(sheet['A1'].value)
print(sheet.cell(row=4, column=2).value)

# 访问行或列
print(sheet['A'])
print(sheet['A':'C'])
print(sheet[1])
print(sheet[1:3])
# 获取所有行或列
row_list = []
for row in sheet.iter_rows():
    row_ls = []
    col_len = len(list(sheet.iter_cols()))
    for cell in row:
        col_len -= 1
        row_ls.append(cell.value)
        if col_len == 0:
            continue
    row_list.append(row_ls)

print(row_list)
'''
[['id', 'name', 'age', 'addr'], ['001', 'Tom', 18, None], ['002', 'Jerry', 17, 'US'], ['003', 'Alice', 20, None]]
'''

4.2、改

# 修改指定值
sheet['C4'].value = 21
sheet.cell(row=4, column=4).value = 'CN'

# 修改操作后要保存
workbook.save(r'C:\Users\cc\Desktop\openpyxl.xlsx')

4.3、删

# 删除指定行或列
sheet.delete_rows(2)

# 删除Excel-Sheet
workbook.remove_sheet(sheet)
del workbook['Sheet']

# 删除操作后要保存
workbook.save(r'C:\Users\cc\Desktop\openpyxl.xlsx')

更多使用见:https://geek-docs.com/python/python-tutorial/python-openpyxl.html


  • 1
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: 可以使用Python中的pandas进行数据分析和表格操作。pandas提供了DataFrame和Series两种数据结构,可以方便地读取、处理和分析数据。以下是一个简单的例子: ```python import pandas as pd # 读取csv文件 data = pd.read_csv('data.csv') # 查看数据前5行 print(data.head()) # 统计每列数据的基本信息 print(data.describe()) # 对数据进行排序 data.sort_values('column_name', inplace=True) # 对数据进行分组并统计数量 grouped_data = data.groupby('column_name').size() # 可视化数据 import matplotlib.pyplot as plt plt.plot(data['column_name'], data['column_name2']) plt.show() ``` 以上代码仅提供了pandas的部分功能,更多详细的用法可以参考官方文档。 ### 回答2: Python数据分析是使用Python编程语言进行数据处理和分析的一种方法。表格是一种常见的数据结构,常用于存储和展示数据。在Python中,可以使用各种和工具来进行数据分析和处理表格数据。 在Python中,最常用的用于数据分析是pandas。pandas是一个功能强大且灵活的开源数据分析,它提供了使用表格数据进行各种处理和分析的方法。使用pandas,可以读取和写入各种格式的表格数据,如csv、Excel和数据等。 在进行数据分析时,可以使用pandas来对表格进行各种操作,如数据清洗、转换和整理。通过pandas的功能,可以对表格数据进行筛选、排序、计算统计指标等操作,以获取对数据的深入理解。 另一个常用的是matplotlib,它是一个用于绘制图表和可视化数据的。使用matplotlib,我们可以将表格数据转换为各种图表类型,如折线图、柱状图、散点图等,以便更直观地理解和呈现数据。 此外,Python还提供了其他一些用于数据分析和工具,如NumPy、SciPy和scikit-learn等。这些可以被用于进行数值计算、统计分析和机器学习等任务。 综上所述,Python数据分析可以通过使用pandas等来处理和分析表格数据,以便更好地理解和利用数据。通过使用Python进行数据分析,我们可以进行各种操作,如数据清洗、转换和整理,同时还可以通过可视化工具来更直观地呈现数据。这些功能使得Python成为一种强大的工具,用于处理和分析表格数据。 ### 回答3: Python数据分析表格是利用Python编程语言进行数据处理和分析的一种方式。Python提供了丰富的和工具,使得我们可以方便地处理和分析各种数据格式的表格数据。 在Python数据分析表格中,常用的包括pandas、NumPy和Matplotlib等。pandas提供了快速、灵活和易于使用的数据结构,如Series和DataFrame,可以方便地读取、处理和分析表格数据。NumPy提供了高性能的数值计算功能,可以对表格数据进行数学运算和统计分析。而Matplotlib则可以用于数据可视化,可以绘制各种类型的图表,如折线图、柱状图和散点图等,以更直观地展示数据分析结果。 在进行数据分析时,我们可以使用pandas读取表格数据,并对数据进行清洗、转换和处理。例如,我们可以删除缺失值、重复值或异常值,进行数据类型转换和格式化等操作。接着,我们可以使用pandas提供的各种函数和方法进行数据分析。例如,我们可以进行数据聚合、排序、筛选和分组,计算统计指标如均值、中位数和标准差等。 同时,我们还可以使用NumPy进行更高级的数值计算和统计分析。例如,我们可以使用NumPy中的函数和方法进行数组运算、线性代数运算和随机数生成。此外,NumPy还提供了许多高级的统计分析工具,如线性回归、假设检验和多元分析等。 最后,我们可以使用Matplotlib数据分析结果进行可视化展示。通过绘制图表,我们可以更直观地观察数据分布、趋势和关联等。这样,我们可以更深入地理解数据,并从中获取有价值的洞察和信息。 总之,Python数据分析表格是一种利用Python编程语言进行数据处理和分析的方法,通过使用pandas、NumPy和Matplotlib等,我们可以方便地读取、处理、分析和可视化各种格式的表格数据。这种方法灵活且功能强大,已经成为数据科学和业务决策中的重要工具。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值