Python数据分析基础之读取Excel

处理Excel文件主要用三个库
xlrd:读取
xlwt:写入
xlutils:Excel高级操作工具`

import xlrd

# 打开Excel工作簿
book = xlrd.open_workbook(r'F:\pycharm\py_workspace\3 Python数据分析实例数据\data\chp4\SOWC 2014 Stat Tables_Table 9.xlsx')

Excel工作簿(book)可以有多个工作表(sheet)
获取数据要先找到指定工作表(sheet)

# # 遍历工作簿的工作表名称有哪些
# for sheet in book.sheets():
#     print(sheet.name)
# '''
# 输出:
# Data Notes
# Table 9
# '''

# 通过名称找到Table 9工作表
sheet = book.sheet_by_name('Table 9')

报错
在这里插入图片描述
解决方法 : 名字后面加一个空格

取到每列每个单元格:

# 获得sheet的行数heet.nrows  遍历取出每行内容sheet.row_values()
for i in range(sheet.nrows):
    row = sheet.row_values(i)

    # 遍历每一行的每一个单元格
    for cell in row:
        print(cell)

分析童工和童婚数据 写成字典格式输出
完整代码如下

'''
处理Excel文件主要用三个库
xlrd:读取
xlwt:写入
xlutils:Excel高级操作工具
'''
import pprint

import xlrd

# 打开Excel工作簿
book = xlrd.open_workbook(r'F:\pycharm\py_workspace\3 Python数据分析实例数据\data\chp4\SOWC 2014 Stat Tables_Table 9.xlsx')

# # 遍历工作簿的工作表名称有哪些
# for sheet in book.sheets():
#     print(sheet.name)
# '''
# Data Notes
# Table 9
# '''

# 通过名称找到Table 9工作表
sheet = book.sheet_by_name('Table 9 ')

# 目标:取得国家的数据并以字典形式输出(从第14行开始)
data = {}
# 获得sheet的行数heet.nrows  遍历取出每行内容sheet.row_values()
for i in range(14, sheet.nrows):
    # 此时row是列表 包含每一行的内容的列表 可以通过索引取值
    row = sheet.row_values(i)
    # 国家名字存储在每排第二个位置
    country = row[1]
    # 写入字典的值
    data[country] = {
        'child_labor': {
            'total': [row[4], row[5]],
            'male': [row[6], row[7]],
            'female': [row[8], row[9]],
        },
        'child_marriage': {
            'married_by_15': [row[10], row[11]],
            'married_by_18': [row[12], row[13]],
        }
    }

pprint.pprint(data['Afghanistan'])


  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值