自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 资源 (2)
  • 收藏
  • 关注

原创 pyspark 自定义函数

一:自定义函数的一般流程# 1.创建普通的python函数def to_upper(s): if s is not None: return s.upper()# 2.注册自定义函数from pyspark.sql.functions import udffrom pyspark.sql.types import StringType#...

2019-05-25 00:38:33 2918

原创 python或pyspark,sql对一个dataframe,排序并排名

输入:输出:具体代码:一:纯python代码import pandas as pddata=pd.DataFrame({'c1':[5,8,3,3,4,1]})print(data)d1= data.sort_values(by='c1')d1['rank']=d1.rank(method='min').astype(int)print(d1)二:pyspa...

2019-05-16 17:30:52 6150

原创 在Jupyter Notebook里运行PySpark

有两种方法配置PySpark driver,当运行pyspark命令就直接自动打开一个Jupyter Notebook,此时shell端不会打开 正常启动Jupyter Notebook,然后用findSpark的package(我选了这种)方法1:配置PySpark driver去~/.bashrc文件添加配置PySpark driver的环境变量export PYSPARK_...

2019-05-10 18:37:27 4480 6

原创 ubuntu 16.04 上启动jupyter服务

1、远程服务器中jupyter 安装pip3installjupyternotebook2、生成配置文件 root@adiao:~#jupyternotebook--generate-config 3、生成密码,进入python3 终端>>>fromnotebook.authimportpasswd>>>p...

2019-05-10 12:46:15 3078

算法图解 像小说一样有趣的算法入门书

编写一本图解式图书。要把难懂的技术主题说清楚,让这本算法书易于理解。与撰写第一篇博文时相比,我的写作水平有了长足进步,但愿你也认为本书内容丰富、易于理解。

2018-08-31

Hadley Wickham tidy data

哈神大作。你值得拥有。相关中文翻译,百度有。先浏览下中文快速学习知识吧

2018-04-17

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除