自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

轻疯侠爱喝茶

数据挖掘工程师

  • 博客(10)
  • 问答 (2)
  • 收藏
  • 关注

原创 阿里云离线数仓

第一章 数仓概念 数仓定义(Data Warehouse) 为企业所有决策制定过程,提供所有系统数据支持的战略合辑 说白了,公司所有的数据都可以汇聚到数据仓库里 公司的数据来源 - 日志采集系统 - 业务系统数据库 - 爬虫系统等 所有业务部门的数据都可以放入数仓,数据库就无法完成这样的功能 数仓的好处 可帮助企业改进业务流程,控制成本,提高产品质量 数仓能做什么 清洗,转义,分类,重组,合并,拆分,统计等 数仓输出到哪里 报表系统 → 用户画像 → 推荐系统 → 机器学习 → 风控系统 第二章

2021-06-15 22:26:00 529

原创 Mysql表设计原则

数据库规范 1.数据库设计基本规范 所有的表使用InnoDB的索引 2.字符集统一使用utf-8 兼容性更好,避免字符集转化产生乱码 转换可能导致索引失效 如果存储emoj表情,则使用utfbmb4字符 3.所有的表和字段都加注释 4.控制单张表数据在500w以下 5.如果不使用分区表 可能造成很大混乱,不宜扩展和维护 6.冷热数据分离,减小表宽度 故名思议,冷数据就是没人访问货很少访问的数据,热数据就是大家都喜欢看的数据 mysql每个表最多存储4096列,并且每一行数据不能超过85535个字节 减

2021-06-15 12:53:15 237

原创 SWOT分析

SWOT分析 企业的优势(strengths) 企业的劣势(weaknesses) 外部的机会(opportunities) 外部的威胁(threats) 真正的SWOT分析是整个战略分析枢纽式的工具 研究一家企业的战略,要去分析外部的行业环境中观的竞争环境,要研究企业内部的资源和能力,然后把它们结合在一起 这里所说的优势和劣势,来自于组织内部能力分析的结果,不是拍脑袋想出来这个企业有什么优势有什么劣势,而是根据前面的资源和能力的分析直接导出的结论 外部的机会和威胁,是从行业分析和竞争分析导出的结论 这就

2021-06-03 14:09:57 1524

原创 面试技巧——自我介绍

面试本质只有三个问题 1. can you do the job(考核能力) 2. will you love the job(考核意愿) 3. can we tolerate working with you(考核团队合作) 为什么要你自我介绍? 面试官没有看你的简历。面试官通常不是做招聘的,所以当他来到面试的房间的时候非常可能并没有看你的简历。 这个问题有什么坑? 1. 要连贯,不要断断续续 如果断断续续会让你显得: ① 没有认真准备这场面试 ② 紧张环境下,你的沟通能力严重打折

2021-06-02 10:41:18 135

原创 SQL刷题(LeetCode-简单-196.删除重复邮箱)

delete from Person where Id in ( select Id from ( select Id, row_number() over(partition by Email order by Id) rn from Person ) t1 where rn>1 ) 使用窗口函数解题 窗口函数可以解决什么问题? 排名:每个班级按成绩来排名 top N:找出每个学科排名前N的同学进行奖励 总之:在每组内排名的问题.

2021-05-26 13:41:52 138

原创 SQL刷题(LeetCode-简单-183.从不订购的客户)

select c.`Name` as Customers from Orders as o right join Customers as c on c.`Id` = o.`CustomerId` where o.`CustomerId` is null

2021-05-25 16:07:11 77

原创 SQL刷题(LeetCode-简单-182.查找重复的电子邮箱)

select p.`Email` from Person as p group by p.`Email` having count(*)>1 对Email出现的次数进行计数,大于1的就说明重复了 count(*)可以不出现在选择列表里

2021-05-25 15:11:38 134

原创 SQL刷题(LeetCode-简单-181.超过经理收入的员工)

select a.`Name` as Employee from Employee as a,Employee as b where a.`ManagerId` = b.`id` and a.`Salary` > b.`Salary` 使用自连接解题,根据筛选条件得到有经理的员工的经理的薪资,再比较员工和其经理的薪资。 ...

2021-05-25 14:36:06 91

原创 SQL刷题(LeetCode-简单-176.第二高的薪水)

select ifnull( (select distinct salary as SecondHighestSalary from Employee order by salary desc limit 1 offset 1) ,null) as SecondHighestSalary 要点 第二高的薪水可能为空,用ifnull解决。 内层select语句形成了一个临时表 .

2021-05-25 11:17:09 59

原创 SQL刷题(LeetCode-简单.175组合两个表)

两种代码执行性能有不小的差异 第一种 select p.`FirstName` ,p.`LastName` ,a.`City` ,a.`State` from Person as p left join Address as a on p.`PersonId` = a.`PersonId` 在这种方法中,查询列表规定了所查询字段的表名,性能如下: 第二种 select FirstName ,LastName ,City

2021-05-25 10:28:25 70

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除