- 博客(210)
- 资源 (2)
- 收藏
- 关注
转载 当面试官要求现场手敲代码,该如何体现你对Python的编程能力?
点击上方“Python数据科学”,星标公众号重磅干货,第一时间送达☞500g+超全学习资源免费领取如果你已经通过了招聘人员的电话面试,那么下面正是该展现你代码能力的时候了。无论是练习...
2020-03-31 21:00:00
530
原创 Spark分布式机器学习源码分析:特征提取与转换
Spark是一个极为优秀的大数据框架,在大数据批处理上基本无人能敌,流处理上也有一席之地,机器学习则是当前正火热AI人工智能的驱动引擎,在大数据场景下...
2020-03-30 21:00:00
633
转载 拜托,别再问我什么是B+树 了
前言 每当我们执行某个 SQL 发现很慢时,都会下意识地反应是否加了索引,那么大家是否有想过加了索引为啥会使数据查找更快呢,索引的底层一般又是用什么结构...
2020-03-30 21:00:00
390
原创 牛客SQL题解 - 查找employees表
题目描述查找employees表所有emp_no为奇数,且last_name不为Mary的员工信息,并按照hire_date逆序排列CREATE TABLE `employees` (`emp_no` int(11) NOT NULL,`birth_date` date NOT NULL,`first_name` varchar(14) NOT NULL,`last_name` va...
2020-03-30 16:51:29
946
原创 牛客SQL题解 - 从titles表获取按照title进行分组,注意对于重复的emp_no进行忽略。
题目描述从titles表获取按照title进行分组,每组个数大于等于2,给出title以及对应的数目t。注意对于重复的emp_no进行忽略。CREATE TABLE IF NOT EXISTS`titles`(`emp_no` int(11) NOT NULL,`title` varchar(50) NOT NULL,`from_date` date NOT NULL,`to_...
2020-03-30 15:43:22
268
原创 牛客SQL题解 - 从titles表获取按照title进行分组
题目描述从titles表获取按照title进行分组,每组个数大于等于2,给出title以及对应的数目t。CREATE TABLE IF NOT EXISTS "titles" (`emp_no` int(11) NOT NULL,`title` varchar(50) NOT NULL,`from_date` date NOT NULL,`to_date` date DEFAULT ...
2020-03-30 15:36:59
990
2
原创 Spark分布式机器学习源码分析:奇异值分解(SVD)与主成分分析(PCA)
原理 Spark是一个极为优秀的大数据框架,在大数据批处理上基本无人能敌,流处理上也有一席之地,机器学习则是当前正火热AI人工智能的驱动引擎,在大...
2020-03-29 21:00:00
1318
转载 【一分钟知识】七种损失函数
主要内容:0-1, Hinge, Logistic, Cross Entropy, Square, Absolute, Huber简述:损失函数刻画了模...
2020-03-29 21:00:00
1114
原创 牛客SQL题解 - 获取所有部门中当前员工薪水最高的相关信息
题目描述获取所有部门中当前员工薪水最高的相关信息,给出dept_no, emp_no以及其对应的salaryCREATE TABLE `dept_emp` (`emp_no` int(11) NOT NULL,`dept_no` char(4) NOT NULL,`from_date` date NOT NULL,`to_date` date NOT NULL,PRIMARY KE...
2020-03-29 17:15:52
782
原创 牛客SQL题解 - 获取所有员工当前的manager
题目描述获取所有员工当前的manager,如果当前的manager是自己的话结果不显示,当前表示to_date='9999-01-01'。结果第一列给出当前员工的emp_no,第二列给出其manager对应的manager_no。CREATE TABLE `dept_emp` (`emp_no` int(11) NOT NULL,`dept_no` char(4) NOT NULL,...
2020-03-29 17:12:50
392
原创 牛客SQL题解 - 获取所有非manager的员工emp_no
题目描述获取所有非manager的员工emp_noCREATE TABLE `dept_manager` (`dept_no` char(4) NOT NULL,`emp_no` int(11) NOT NULL,`from_date` date NOT NULL,`to_date` date NOT NULL,PRIMARY KEY (`emp_no`,`dept_no`));...
2020-03-29 17:09:53
406
原创 Spark MLlib分布式机器学习源码分析:隐式狄利克雷分布(LDA)
原理 Spark是一个极为优秀的大数据框架,在大数据批处理上基本无人能敌,流处理上也有一席之地,机器学习则是当前正火热AI人工智能的驱动引擎,在大数据场景下如何发挥AI技术成为优秀的大数据挖掘工程师必备技能。本文结合机器学习思想与Spark框架代码结构来实现分布式机器学习过程,希望与大家一起学习进步~目录1.LDA原理介绍2.LDA参数3.Spark示例4.源码解析...
2020-03-29 11:32:21
937
转载 【图文并茂】通过实例理解word2vec之Skip-gram
作者:猫猫 CSDN:猫猫玩机器学习导读word2vec主要实现方法是Skip-gram和CBOW,CBOW的目标是根据上下文来预测当前词的...
2020-03-28 21:00:00
997
原创 牛客SQL题解 - 获取所有部门当前manager的当前薪水情况
题目描述获取所有部门当前manager的当前薪水情况,给出dept_no, emp_no以及salary,当前表示to_date='9999-01-01'CREATE TABLE `dept_manager` (`dept_no` char(4) NOT NULL,`emp_no` int(11) NOT NULL,`from_date` date NOT NULL,`to_date...
2020-03-28 11:06:42
353
原创 牛客SQL题解 - 找出所有员工当前薪水salary情况
题目描述找出所有员工当前(to_date='9999-01-01')具体的薪水salary情况,对于相同的薪水只显示一次,并按照逆序显示CREATE TABLE `salaries` (`emp_no` int(11) NOT NULL,`salary` int(11) NOT NULL,`from_date` date NOT NULL,`to_date` date NOT NUL...
2020-03-28 11:03:35
461
原创 牛客SQL题解 - 查找薪水涨幅超过15次的员工号emp_no以及其对应的涨幅次数t
题目描述查找薪水涨幅超过15次的员工号emp_no以及其对应的涨幅次数tCREATE TABLE `salaries` (`emp_no` int(11) NOT NULL,`salary` int(11) NOT NULL,`from_date` date NOT NULL,`to_date` date NOT NULL,PRIMARY KEY (`emp_no`,`from_d...
2020-03-28 11:00:09
377
原创 Spark MLlib分布式机器学习源码分析:K-means聚类
Spark是一个极为优秀的大数据框架,在大数据批处理上基本无人能敌,流处理上也有一席之地,机器学习则是当前正火热AI人工智能的驱动引擎,在大数据场景下如何发挥AI技术成为优秀的大数据挖掘工程师必备技能。本文结合机器学习思想与Spark框架代码结构来实现分布式机器学习过程,希望与大家一起学习进步~目录1.Kmeans聚类2.Kmeans++3.Kmeans||...
2020-03-28 10:54:03
1572
转载 算法越学越扎心?这有一篇学习心得请查收!
来源公众号:帅地玩编程作者:帅地对于算法的学习,我也是从一个小白一步步走来,当然,现在仍然很菜,,,不过,鉴于我觉得还有一些人比我更菜了,我决定谈谈我算...
2020-03-27 21:00:00
393
原创 2020 BAT大厂面试经验:最全大数据+AI方向面试100题(附答案详解)
“高频面经“系列共分为五篇,数据分析篇、数据结构与算法篇、大数据研发篇、机器学习篇和深度学习篇,每篇20问,共100问。这“100问”,与其说是面试中出现频率较高的“考题”,更不如说是大数据和AI方向构建完整知识体系的“知识点”。点击下方各篇链接即可进入查阅相应参考答案,更好内容直接关注公众号“雨云飞”回复“学习资料”获取! 欢迎关注作者微信公众号:涉及数据分析与挖掘、数据结构...
2020-03-27 10:21:05
3910
原创 Spark MLlib分布式机器学习源码分析:协同过滤
Spark是一个极为优秀的大数据框架,在大数据批处理上基本无人能敌,流处理上也有一席之地,机器学习则是当前正火热AI人工智能的驱动引擎,在大数据场景下如何发挥AI技术成为优秀的大数据挖掘工程师必备技能。本文结合机器学习思想与Spark框架代码结构来实现分布式机器学习过程,希望与大家一起学习进步~目录1.协同过滤参数2.交替最小二乘(ALS)3.Spark实现ALS原理...
2020-03-27 09:45:02
668
原创 Spark MLlib分布式机器学习源码分析:集成树模型
Spark是一个极为优秀的大数据框架,在大数据批处理上基本无人能敌,流处理上也有一席之地,机器学习则是当前正火热AI人工智能的驱动引擎,在大数据场景下如何发挥AI技术成为优秀的大数据挖掘工程师必备技能。本文结合机器学习思想与Spark框架代码结构来实现分布式机器学习过程,希望与大家一起学习进步~目录1.随机森林概念2随机森林参数3.随机森林实例4.随机森林源码5...
2020-03-26 14:57:39
704
转载 清洗数据,我习惯用这 7 步!
数据清洗 (data cleaning) 是机器学习和深度学习进入算法步前的一项重要任务,我平时比较习惯使用的 7 个步骤,总结如下:Step1 : r...
2020-03-25 21:00:00
481
原创 牛客SQL题解 - 查找所有员工入职时候的薪水情况
题目描述查找所有员工入职时候的薪水情况,给出emp_no以及salary, 并按照emp_no进行逆序CREATE TABLE `employees` (`emp_no` int(11) NOT NULL,`birth_date` date NOT NULL,`first_name` varchar(14) NOT NULL,`last_name` varchar(16) NOT N...
2020-03-25 16:38:38
331
原创 牛客SQL题解 - 查找所有员工的last_name和first_name以及对应部门编号dept_no
题目描述查找所有员工的last_name和first_name以及对应部门编号dept_no,也包括展示没有分配具体部门的员工CREATE TABLE `dept_emp` (`emp_no` int(11) NOT NULL,`dept_no` char(4) NOT NULL,`from_date` date NOT NULL,`to_date` date NOT NULL,P...
2020-03-25 16:35:31
503
原创 牛客SQL题解 - 查找所有已经分配部门的员工的last_name和first_name以及dept_no
题目描述查找所有已经分配部门的员工的last_name和first_name以及dept_noCREATE TABLE `dept_emp` (`emp_no` int(11) NOT NULL,`dept_no` char(4) NOT NULL,`from_date` date NOT NULL,`to_date` date NOT NULL,PRIMARY KEY (`emp...
2020-03-25 16:32:56
1626
原创 Spark MLlib分布式机器学习源码分析:决策树算法
Spark是一个极为优秀的大数据框架,在大数据批处理上基本无人能敌,流处理上也有一席之地,机器学习则是当前正火热AI人工智能的驱动引擎,在大数据场景下如何发挥AI技术成为优秀的大数据挖掘工程师必备技能。本文结合机器学习思想与Spark框架代码结构来实现分布式机器学习过程,希望与大家一起学习进步~目录1.决策树理论2.Spark实例3.源码分析 本文采用的...
2020-03-25 09:22:29
1473
转载 那些功能逆天,却鲜为人知的pandas骚操作
点击上方“Python数据科学”,星标公众号重磅干货,第一时间送达☞500g+超全学习资源免费领取文章来源:Python数据科学作者:东哥panda...
2020-03-24 21:05:55
660
原创 牛客SQL题解 - 查找当前薪水详情以及部门编号dept_no
题目描述查找各个部门当前(to_date='9999-01-01')领导当前薪水详情以及其对应部门编号dept_noCREATE TABLE `dept_manager` (`dept_no` char(4) NOT NULL,`emp_no` int(11) NOT NULL,`from_date` date NOT NULL,`to_date` date NOT NULL,PR...
2020-03-24 15:06:27
438
原创 牛客SQL题解 - 查找入职员工时间排名倒数第三的员工所有信息
题目描述查找入职员工时间排名倒数第三的员工所有信息CREATE TABLE `employees` (`emp_no` int(11) NOT NULL,`birth_date` date NOT NULL,`first_name` varchar(14) NOT NULL,`last_name` varchar(16) NOT NULL,`gender` char(1) NOT ...
2020-03-24 15:00:04
828
原创 牛客SQL题解 - 查找最晚入职员工的所有信息
题目描述查找最晚入职员工的所有信息CREATE TABLE `employees` (`emp_no` int(11) NOT NULL,`birth_date` date NOT NULL,`first_name` varchar(14) NOT NULL,`last_name` varchar(16) NOT NULL,`gender` char(1) NOT NULL,`h...
2020-03-24 14:55:19
442
转载 python爬取招聘网站数据,利用Tableau可视化交互大屏,指导你如何学习、找工作!...
↑关注 + 星标~有趣的不像个技术号每晚九点,我们准时相约大家好,我是黄同学交流群预热好久的可视化交互大屏来啦1、项目背景 随着科技的飞速发展...
2020-03-23 21:00:00
313
1
转载 python爬取招聘网站数据,利用Tableau可视化交互大屏,指导你如何学习、找工作!...
↑关注 + 星标~有趣的不像个技术号每晚九点,我们准时相约大家好,我是黄同学交流群预热好久的可视化交互大屏来啦1、项目背景 随着科技的飞速发展,数据呈现爆发式的增长,任何人都摆...
2020-03-23 21:00:00
398
原创 Python数据结构与算法:一文带你跨过“递归”门槛
注:今天博主开始更新数据结构与算法中的排序算法系列,使用Python语言实现,涉及基本数据结构、十大排序算法、递归分治、贪心动归等,意在帮大家更加容易的学习数据结构与算法以及进一步梳理这些知识点。目录递归的组成结构如何凑集一笔巨款用于公益事业?算法代码总结递归算法的执行斐波那契序列算法代码跟踪递归函数的执行过程求斐波那契序列算法的时间复杂度利用递归...
2020-03-23 17:53:38
708
原创 Spark MLlib分布式机器学习源码分析:朴素贝叶斯
Spark是一个极为优秀的大数据框架,在大数据批处理上基本无人能敌,流处理上也有一席之地,机器学习则是当前正火热AI人工智能的驱动引擎,在大数据场景下如何发挥AI技术成为优秀的大数据挖掘工程师必备技能。本文结合机器学习思想与Spark框架代码结构来实现分布式机器学习过程,希望与大家一起学习进步~目录1.贝叶斯模型思想2.贝叶斯模型原理3.Spark实例4.源码分析...
2020-03-23 16:40:43
959
原创 Ubuntu启动谷歌浏览器Chrome时出现 "输入密码以解锁您的登陆密钥环"
问题出现原因Ubuntu安全自动给浏览器加入密码环问题解决方案方案一:直接取消密码环1.按下"win键"[就是上面一个windows标识的那个键],弹出个系统开始菜单界面(左上角的搜索菜单)2.搜索"密码",会自动过滤出"密钥和密码",英文是"password and keys",但都可以用英文进行搜索,点开即可.3.打开后应该有好几个密钥归类,默认应该有个"logi...
2020-03-23 16:35:39
10367
2
原创 别找了,这是python3网络爬虫从入门到进阶最详细的干货教程(附最强理论总结和五大代码案例)
历时数十天打磨,参考了诸多爬虫理论和实战资料,制作出爬虫从入门到进阶的详细纯干货教程,相信对于想学习爬虫的同学来讲是非常好的福利。此外更好的内容可以关注公众号“雨云飞”,笔者研究生即将毕业,签约BAT,后续会奉献更好的作品给大家~谢谢!目录Python网络爬虫数据采集实战:基础知识内容概要链接直达Python网络爬虫数据采集实战:Requests和Re库内容概要链接...
2020-03-22 19:28:10
2866
1
原创 Ubuntu19.10 MacOS主题安装优化教程(附资源下载)
有关Ubuntu19.10双系统的安装可参考下面博文:win10+ubuntu19.10双系统安装(最详细!附镜像资源+分区详解+实测教程)下面开始美化教程:先附上我优化之后的截图1.安装tweaksudo apt install gnome-tweak-tool2.主题下载在gnome look上下载主题鼠标主题和图标图为仿mac的主题MacOS-theme...
2020-03-22 17:43:14
1324
原创 Spark MLlib分布式机器学习源码分析:线性模型
Spark是一个极为优秀的大数据框架,在大数据批处理上基本无人能敌,流处理上也有一席之地,机器学习则是当前正火热AI人工智能的驱动引擎,在大数据场景下如何发挥AI技术成为优秀的大数据挖掘工程师必备技能。本文结合机器学习思想与Spark框架代码结构来实现分布式机器学习过程,希望与大家一起学习进步~目录1.数学公式2.线性回归3.逻辑回归4.线性支持向量机...
2020-03-22 13:24:12
726
原创 Ubuntu vscode运行python文件提示python: not found
问题出现原因Ubuntu默认Python版本已改为Python3,所以找不到python路径问题解决办法在终端中输入以下命令,给python创建软连接,指向python3.x,具体视自己Ubuntu python所带版本而定sudo ln -s /usr/bin/python3.7 /usr/bin/python之后就发现可以正常在vscode中运行python...
2020-03-22 12:17:22
4783
转载 一文带你打Kaggle!记一次美妙的数据分析之旅~
本项目基于Kaggle电影影评数据集,通过这个系列,你将学到如何进行数据探索性分析(EDA),学会使用数据分析利器pandas,会用绘图包pyechar...
2020-03-22 11:00:00
455
Python极详细思维导图PDF高清合辑
2023-03-12
《Python数据结构与算法》教程及代码
2020-02-26
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅