自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

武西亮的博客

大数据数据分析python,mysql,spark,tidb

  • 博客(13)
  • 收藏
  • 关注

原创 matplotlib.pyplot画图并导出保存

直接上代码: import pandas as pdimport numpy as npimport matplotlib.pyplot as pltfig, ax = plt.subplots()bar_positions=[1,2,3,4]bar_heights=[1,2,3,4]print(np.arange(len([2,2,3,4,5])+1))ax.bar(np.a...

2018-09-16 18:02:01 28080

原创 pyspark学习笔记,欢迎朋友们留言交流探讨!

直接上代码:粘贴格式很乱,可以直接点击我的印象笔记:https://app.yinxiang.com/shard/s60/nl/11100943/831e454b-b206-4b3f-93fb-00aa1e357172  1.建立spark appfrom pyspark.sql import SparkSessionbuilder = SparkSession.bu...

2018-09-16 17:56:31 577

原创 seaborn各种图表学习

import pandas as pdfrom matplotlib import pyplot as plt%matplotlib inlineimport seaborn as sns #读取数据df=pd.read_csv('seaborn.csv',sep=',',encoding='utf-8',index_col=0)df.head()  Name...

2018-09-16 17:28:57 1937

原创 AARRR增长黑客模型

第一个A是获取客户的意思.第二个A是激活客户,第一个R是提高客户留存.第二个R是增加客户销售转化,第三个R是客户口碑传播从一到四就是一个漏斗...

2018-09-16 12:53:39 1694

原创 呵呵

plotly可以制作交互式图表,直接上代码:import plotly.offline as pyfrom plotly.graph_objs import Scatter, Layoutimport plotly.graph_objs as gopy.init_notebook_mode(connected=True)import pandas as pdimport numpy...

2018-09-16 02:48:20 8500 2

原创 mysql join之:on条件 和 where条件对比

#table adrop table if exists tablea;CREATE TABLE tablea (`name` varchar(11) COMMENT '姓名',`score` int(11) COMMENT '分数',`salary` int(11) COMMENT '分数',`create_time` datetime COMMENT '读书时间',`class`...

2018-09-10 17:48:43 1989

原创 pyspark group_concat

from pyspark.sql.column import Columnfrom pyspark.sql.column import _to_java_columnfrom pyspark.sql.column import _to_seq spark = SparkSession.builder.appName("scala_udf_test").getOrCreate()sc = ...

2018-09-09 21:49:09 1445

转载 Spark DataFrame中的join类型

原文:https://blog.csdn.net/anjingwunai/article/details/51934921Spark DataFrame中的join类型2016年07月17日 22:03:33 阅读数:13979Spark DataFrame中join与SQL很像,都有inner join, left join, right join, full join; 那么jo...

2018-09-09 13:10:02 7423 2

转载 总结:Hive,Hive on Spark和SparkSQL区别

原文:https://blog.csdn.net/MrLevo520/article/details/76696073?locationNum=2&fps=1总结:Hive,Hive on Spark和SparkSQL区别2017年08月04日 22:36:07 阅读数:18083 标签: sparkmapreducehive大数据 更多个人分类: HiveSparkHadoo...

2018-09-09 11:56:38 2274

转载 hivesql中datediff,date_add和date_sub的用法

原文:https://blog.csdn.net/qq_35958094/article/details/80460644hivesql中datediff,date_add和date_sub的用法2018年05月26日 12:00:38 阅读数:2020更多个人分类: sql1.日期比较函数: datediff语法: datediff(string enddate,string s...

2018-09-09 11:43:54 10000

转载 Python timedelta(转)

Python timedelta(转)2017年11月04日 21:59:15 阅读数:905更多个人分类: Python版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/fengmm521/article/details/78446460datetime.timedelta对象代表两个时间之间的的时间差,两个date或datetim...

2018-09-09 11:37:06 1545

转载 Pandas详解六之Timestamp、Period、Timedelta时间对象

原文:https://blog.csdn.net/weixin_38168620/article/details/795965262018年03月17日 22:28:41 阅读数:2797 标签: 时间对象PandasTimestampPeriodTimedelta 更多个人分类: Python机器学习数据挖掘所属专栏: 数据分析利器--Pandas约定:import pan...

2018-09-09 11:36:09 3306

原创 jupyter远程登陆

 第一步:生成config文件。终端输入:jupyter notebook --generate-config(如果是root用户请用:jupyter notebook --generate-config --allow-config)执行成功应该会显示:Writing default config to: /home/wxl/.jupyter/jupyter_notebo...

2018-09-08 16:07:33 4791

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除