Databricks：有用的代码集锦

最新推荐文章于 2024-07-19 16:12:43 发布

悦光阴

最新推荐文章于 2024-07-19 16:12:43 发布

阅读量582

点赞数

文章标签： sql spark javascript

本文链接：https://blog.csdn.net/upluck/article/details/122264726

版权

本文总结了在工作中用过的脚本

1，列出folder中的所有文件

%python
display(dbutils.fs.ls("dbfs:/mnt/folder/"))

2，改变表的列

由于Azure Databricks不支持修改列，所以可以通过把数据表重命名，然后创建一个同名的表来实现列的改变

%sql

alter table capsbi.table_data
rename to capsbi.table_data_old;

create table capsbi.table_data
using delta
as 
select column_1, ...
from capsbi.table__data_old;

3，检查表的schema

%python

sql_query="select * from CAPSBI.vw_table_data limit 1"
df = spark.sql(sql_query)
print(df.dtypes)

参考文档：

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

悦光阴

关注关注

0
点赞
踩
6

收藏

觉得还不错? 一键收藏
打赏
1
评论
Databricks：有用的代码集锦

本文总结了在工作中用过的脚本1，列出folder中的所有文件%pythondisplay(dbutils.fs.ls("dbfs:/mnt/folder/"))2，改变表的列由于Azure Databricks不支持修改列，所以可以通过把数据表重命名，然后创建一个同名的表来实现列的改变%sqlalter table capsbi.table_datarename to c...
复制链接

扫一扫