python读取excel生成HiveDDL

在数仓建模中,通过Python程序读取Excel文件中的表结构信息(字段名、类型、描述),自动生成Hive DDL语句,以提升建表和开发效率。同时强调了遵循开发规范的重要性,确保团队沟通和维护的顺畅。
摘要由CSDN通过智能技术生成

需求说明:

数仓建模过程中,一般会在excel中先将数仓各层的表和字段都梳理好,然后再建表和开发。该程序可以方便的利用excel中的字段名、字段类型、字段描述等信息生成HiveDDL语句

数据示例:

在这里插入图片描述
在这里插入图片描述

输出示例:

在这里插入图片描述

代码:

import os
import sys

import xlrd

# 要读取的excel的名称
excel_name = sys.argv[1]
# 存放ddl的目录
dir = sys.argv[2]
# 开始读取的sheet页的下标(默认要读取的sheet页是以此为分割)
num=sys.argv[3]


# 检验是否全是英文字符
def is_all_English(strs):
    for _char in str(strs):
        if '\u4e00' <= _char <= '\u9fa5':
            return False
    return True


book = xlrd.open_workbook(excel_name)
for sheet_num in range(int(num), len(book.sheets()) - 1):
    # 工作sheet
    sheet_index = book.sheets()[sheet_num]

    if sheet_index.cell(0,0).value.strip().startswith(<
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值