![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
小知识
文章平均质量分 92
NoOne-csdn
永远年轻,永远热泪盈眶
展开
-
pyspark必知必会(持续更新中)
RDD 和DF 联系 都是弹性分布式数据集,轻量集 惰性机制,延迟计算 根据内存情况,自动缓存,加快计算速度 都有partition概念 众多相同的算子 区别 DF引入了schema和off-heap schema RDD每一行的数据结构都是一样的 off-heap 意味着JVM堆以外的内存 RDD 优点: 强大,内置很多函数操作,group,map,filter等,方便处理结...原创 2020-04-16 16:09:34 · 735 阅读 · 0 评论 -
python必知必会(持续更新)
最近在刷leetcode 发现python好多小知识点是一知半解,不能熟练使用。 特做此笔记。 list.sort(cmp=None, key=None, reverse=False) 解决问题: 列表的元素的部分值排序 dem 题目应用: 重新排列日志文件 背景:非全部字符排序 a,b=log.split(" ", 1) Python split() 通过指定分隔符对字符串进行切片,如果...原创 2020-04-14 16:04:05 · 318 阅读 · 0 评论