自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(12)
  • 收藏
  • 关注

原创 2021-01-18

-- 175组合两个表select p.fristname,p.lastname,a.city,a.state from person p left join address a on p.personid=a.personid

2021-01-18 11:53:07 120

原创 sublime大法

1,鼠标选中多行,按下 Ctrl Shift L (Command Shift L) 即可同时编辑这些行;2,鼠标选中文本,反复按 CTRL D (Command D) 即可继续向下同时选中下一个相同的文本进行同时编辑;3,鼠标选中文本,按下 Alt F3 (Win) 或 Ctrl Command G(Mac) 即可一次性选择全部的相同文本进行同时编辑;4,Shift 鼠标右键 (W...

2020-04-29 10:09:37 159

原创 python 列表

li = [0, 1, 2, 3, 4, 5, 6, 7, 8]print("li[-1:]: ", li[-1:])print("li[:-1]: ", li[:-1])print("li[0:2]: ", li[0:2])输出li[-1:]: [8]li[:-1]: [0, 1, 2, 3, 4, 5, 6, 7]li[0:2]: [0, 1]

2020-04-07 10:59:35 104

原创 pandas连接数据库

python强大的处理数据的能力很大一部分来自Pandas,pandas不仅限于读取本地的离线文件,也可以在线读取数据库的数据,处理后再写回数据库中。pandas主要是以sqlalchemy方式与数据库建立链接,支持Mysql、postgresql、Oracle、MS SQLServer、SQLite等主流数据库。一:创建链接数据库引擎from sqlalchemy import crea...

2020-04-03 16:24:56 1623

原创 hive 去掉重复数据,仅显示需要一条

select count(1) ,count(distinct student_no)from( select cj.student_no ,if(cj.kpi_year<'2018/08','2018年8月前',kpi_year) as contract_year ,row_number() over (partition by cj.s...

2020-03-31 11:11:36 4348

原创 mysql、hive写法互换

--mysql,REVERSE(SUBSTRING_INDEX(REVERSE(depart_name), ',', 1)) ,SUBSTRING_INDEX(depart_name, ',',-1)--hive,reverse(split(reverse(depart_name),',')[0]),split(depart_name,',')[length(depart_n...

2020-03-25 11:29:33 198

原创 概率练习

概率练习在这个练习中,你将模拟掷硬币和掷骰子,计算下列结果的比例。两次均衡掷硬币得到两次正面 三次均衡掷硬币得到一次正面 P(H) = 0.6 时三次非均衡掷硬币得到一次正面 一次掷骰子得到偶数 两次掷骰子得到相同值然后,你在下面的练习中对比这些比例的概率。模拟掷硬币时,0 代表正面,1 代表反面。模拟掷骰子时,使用正确的整数,匹配标准六面骰子上的数字。Coin Fli...

2018-10-30 14:11:43 423 1

原创 项目练习

 接下来的三个练习将帮助你更好地完成项目。这些问题都用到了项目中 chicago.csv 数据集的迷你版。练习题 1:计算最受欢迎的开始时间使用 pandas 在 dataframe 中加载 chicago.csv,并找到人们开始出行频率最高的 hour 时刻。数据集中并没有 hour 列,但你可以通过提取 “Start Time” 中的 hour 来创建 hour 列。为了完成这一点...

2018-09-04 14:59:38 742

原创 项目四

分析 A/B 测试结果数据分析师和数据学家经常使用 A/B 测试。利用一些练习解决其中的难题,对你来说非常重要。在这个项目中,你将会理解电子商务网站运营 A/B 测试的结果。你的目标是通过这个 Notebook,帮助公司理解他们是否应该设计新页面、保留原有网页或延长测试时间以便做出决定。页面中的数据和 Jupyter Notebook 包含你完成项目的所有文件,是可供下载的压缩文件,你...

2018-09-04 14:58:57 175

原创 项目三

项目详情 我要如何完成该项目?该项目与数据分析入门课程相关,但根据你的知识背景,你可能无需学习全部课程即可完成该项目。介绍在此项目中,你需要进行数据分析,并创建一个文档分享你的发现。你应该首先了解数据集,想想它可以用来回答哪些问题。然后,你应该使用 Pandas 和 NumPy 回答你最感兴趣的问题,并编写一份报告来分享你的结论。你不需要使用推论统计或机器学习知识来完成此项目,...

2018-09-04 14:57:43 244

原创 项目二

自行车共享数据在过去十年内,自行车共享系统的数量不断增多,并且在全球多个城市内越来越受欢迎。自行车共享系统使用户能够按照一定的金额在短时间内租赁自行车。用户可以在 A 处借自行车,并在 B 处还车,或者他们只是想骑一下,也可以在同一地点还车。每辆自行车每天可以供多位用户使用。由于信息技术的迅猛发展,共享系统的用户可以轻松地访问系统中的基座并解锁或还回自行车。这些技术还提供了大量数据,使我们...

2018-09-03 17:09:59 213

原创 利用map和reduce编写一个str2float函数,把字符串'123.456'转换成浮点数123.456

from functools import reducedef str2float(s): def fn(x,y): return x*10+y n=s.index('.') s1=list(map(int,[x for x in s[:n]])) s2=list(map(int,[x for x is[n+1:]])) return r...

2018-06-01 11:32:50 1715

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除