自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(8)
  • 收藏
  • 关注

原创 python和pyspark数据处理的区别

1、python的dataframe,是单机数据集,只适用于处理少数据量;2、pyspark的RDD,是分布式弹性数据集,适用于处理大数据量。

2024-09-15 09:27:30 101

原创 python发送ecxel文件到企微群

指定消息类型=file。1、上传到企微,获取media_id;

2024-09-10 18:34:15 137

原创 pthon map,apply和applymap的区别

1、map是serise对象的方法;apply是dataframe和serise对象的方法;applymap是dataframe对象的方法;2、map应用于对象中的每个元素;apply应用于对象中行或列中的元素;applymap应用于对象中的每个元素。

2024-09-07 19:14:12 97

原创 python dataframe合并报错

2024-09-06 18:08:21 110

原创 python:‘SeriesGroupBy‘ object has no attribute ‘to_excel‘

把data1转出dataframe,pd.DataFrame(group)data1不是dataframe。

2024-09-06 18:06:19 211

原创 hive on spark报错:Failed to create Spark client for Spark session

解决办法:增加重试次数。

2024-09-06 16:13:11 105

原创 hive创建udf函数

hue执行ADD JAR /tmp/zgj/fenxiao1.jar;

2024-09-05 15:45:13 121

原创 sqoop采集数据到hive

@sqoop采集数据到hive1、oracle抽取数据到hive本身是map,可指定map的个数;可增量或全量抽;通过shell脚本可批量抽取应用场景:将表从关系型数据库抽取到hive或hdfs分隔符问题导致数据量变多,参考https://blog.csdn.net/qq_38250124/article/details/84331037null值问题:hive官方文档关于null值的描...

2019-10-31 11:11:24 612

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除