自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

大数据之眸

手握代码,心怀天下。专注大数据挖掘与机器学习

  • 博客(210)
  • 资源 (2)
  • 收藏
  • 关注

转载 当面试官要求现场手敲代码,该如何体现你对Python的编程能力?

点击上方“Python数据科学”,星标公众号重磅干货,第一时间送达☞500g+超全学习资源免费领取如果你已经通过了招聘人员的电话面试,那么下面正是该展现你代码能力的时候了。无论是练习...

2020-03-31 21:00:00 530

原创 Spark分布式机器学习源码分析:特征提取与转换

Spark是一个极为优秀的大数据框架,在大数据批处理上基本无人能敌,流处理上也有一席之地,机器学习则是当前正火热AI人工智能的驱动引擎,在大数据场景下...

2020-03-30 21:00:00 633

转载 拜托,别再问我什么是B+树 了

前言 每当我们执行某个 SQL 发现很慢时,都会下意识地反应是否加了索引,那么大家是否有想过加了索引为啥会使数据查找更快呢,索引的底层一般又是用什么结构...

2020-03-30 21:00:00 390

原创 牛客SQL题解 - 查找employees表

题目描述查找employees表所有emp_no为奇数,且last_name不为Mary的员工信息,并按照hire_date逆序排列CREATE TABLE `employees` (`emp_no` int(11) NOT NULL,`birth_date` date NOT NULL,`first_name` varchar(14) NOT NULL,`last_name` va...

2020-03-30 16:51:29 946

原创 牛客SQL题解 - 从titles表获取按照title进行分组,注意对于重复的emp_no进行忽略。

题目描述从titles表获取按照title进行分组,每组个数大于等于2,给出title以及对应的数目t。注意对于重复的emp_no进行忽略。CREATE TABLE IF NOT EXISTS`titles`(`emp_no` int(11) NOT NULL,`title` varchar(50) NOT NULL,`from_date` date NOT NULL,`to_...

2020-03-30 15:43:22 268

原创 牛客SQL题解 - 从titles表获取按照title进行分组

题目描述从titles表获取按照title进行分组,每组个数大于等于2,给出title以及对应的数目t。CREATE TABLE IF NOT EXISTS "titles" (`emp_no` int(11) NOT NULL,`title` varchar(50) NOT NULL,`from_date` date NOT NULL,`to_date` date DEFAULT ...

2020-03-30 15:36:59 990 2

原创 Spark分布式机器学习源码分析:奇异值分解(SVD)与主成分分析(PCA)

原理 Spark是一个极为优秀的大数据框架,在大数据批处理上基本无人能敌,流处理上也有一席之地,机器学习则是当前正火热AI人工智能的驱动引擎,在大...

2020-03-29 21:00:00 1318

转载 【一分钟知识】七种损失函数

主要内容:0-1, Hinge, Logistic, Cross Entropy, Square, Absolute, Huber简述:损失函数刻画了模...

2020-03-29 21:00:00 1114

原创 牛客SQL题解 - 获取所有部门中当前员工薪水最高的相关信息

题目描述获取所有部门中当前员工薪水最高的相关信息,给出dept_no, emp_no以及其对应的salaryCREATE TABLE `dept_emp` (`emp_no` int(11) NOT NULL,`dept_no` char(4) NOT NULL,`from_date` date NOT NULL,`to_date` date NOT NULL,PRIMARY KE...

2020-03-29 17:15:52 782

原创 牛客SQL题解 - 获取所有员工当前的manager

题目描述获取所有员工当前的manager,如果当前的manager是自己的话结果不显示,当前表示to_date='9999-01-01'。结果第一列给出当前员工的emp_no,第二列给出其manager对应的manager_no。CREATE TABLE `dept_emp` (`emp_no` int(11) NOT NULL,`dept_no` char(4) NOT NULL,...

2020-03-29 17:12:50 392

原创 牛客SQL题解 - 获取所有非manager的员工emp_no

题目描述获取所有非manager的员工emp_noCREATE TABLE `dept_manager` (`dept_no` char(4) NOT NULL,`emp_no` int(11) NOT NULL,`from_date` date NOT NULL,`to_date` date NOT NULL,PRIMARY KEY (`emp_no`,`dept_no`));...

2020-03-29 17:09:53 406

原创 Spark MLlib分布式机器学习源码分析:隐式狄利克雷分布(LDA)

原理 Spark是一个极为优秀的大数据框架,在大数据批处理上基本无人能敌,流处理上也有一席之地,机器学习则是当前正火热AI人工智能的驱动引擎,在大数据场景下如何发挥AI技术成为优秀的大数据挖掘工程师必备技能。本文结合机器学习思想与Spark框架代码结构来实现分布式机器学习过程,希望与大家一起学习进步~目录1.LDA原理介绍2.LDA参数3.Spark示例4.源码解析...

2020-03-29 11:32:21 937

转载 【图文并茂】通过实例理解word2vec之Skip-gram

作者:猫猫 CSDN:猫猫玩机器学习导读word2vec主要实现方法是Skip-gram和CBOW,CBOW的目标是根据上下文来预测当前词的...

2020-03-28 21:00:00 997

原创 牛客SQL题解 - 获取所有部门当前manager的当前薪水情况

题目描述获取所有部门当前manager的当前薪水情况,给出dept_no, emp_no以及salary,当前表示to_date='9999-01-01'CREATE TABLE `dept_manager` (`dept_no` char(4) NOT NULL,`emp_no` int(11) NOT NULL,`from_date` date NOT NULL,`to_date...

2020-03-28 11:06:42 353

原创 牛客SQL题解 - 找出所有员工当前薪水salary情况

题目描述找出所有员工当前(to_date='9999-01-01')具体的薪水salary情况,对于相同的薪水只显示一次,并按照逆序显示CREATE TABLE `salaries` (`emp_no` int(11) NOT NULL,`salary` int(11) NOT NULL,`from_date` date NOT NULL,`to_date` date NOT NUL...

2020-03-28 11:03:35 461

原创 牛客SQL题解 - 查找薪水涨幅超过15次的员工号emp_no以及其对应的涨幅次数t

题目描述查找薪水涨幅超过15次的员工号emp_no以及其对应的涨幅次数tCREATE TABLE `salaries` (`emp_no` int(11) NOT NULL,`salary` int(11) NOT NULL,`from_date` date NOT NULL,`to_date` date NOT NULL,PRIMARY KEY (`emp_no`,`from_d...

2020-03-28 11:00:09 377

原创 Spark MLlib分布式机器学习源码分析:K-means聚类

​ Spark是一个极为优秀的大数据框架,在大数据批处理上基本无人能敌,流处理上也有一席之地,机器学习则是当前正火热AI人工智能的驱动引擎,在大数据场景下如何发挥AI技术成为优秀的大数据挖掘工程师必备技能。本文结合机器学习思想与Spark框架代码结构来实现分布式机器学习过程,希望与大家一起学习进步~目录1.Kmeans聚类2.Kmeans++3.Kmeans||...

2020-03-28 10:54:03 1572

转载 算法越学越扎心?这有一篇学习心得请查收!

来源公众号:帅地玩编程作者:帅地对于算法的学习,我也是从一个小白一步步走来,当然,现在仍然很菜,,,不过,鉴于我觉得还有一些人比我更菜了,我决定谈谈我算...

2020-03-27 21:00:00 393

原创 2020 BAT大厂面试经验:最全大数据+AI方向面试100题(附答案详解)

“高频面经“系列共分为五篇,数据分析篇、数据结构与算法篇、大数据研发篇、机器学习篇和深度学习篇,每篇20问,共100问。这“100问”,与其说是面试中出现频率较高的“考题”,更不如说是大数据和AI方向构建完整知识体系的“知识点”。点击下方各篇链接即可进入查阅相应参考答案,更好内容直接关注公众号“雨云飞”回复“学习资料”获取! 欢迎关注作者微信公众号:涉及数据分析与挖掘、数据结构...

2020-03-27 10:21:05 3910

原创 Spark MLlib分布式机器学习源码分析:协同过滤

Spark是一个极为优秀的大数据框架,在大数据批处理上基本无人能敌,流处理上也有一席之地,机器学习则是当前正火热AI人工智能的驱动引擎,在大数据场景下如何发挥AI技术成为优秀的大数据挖掘工程师必备技能。本文结合机器学习思想与Spark框架代码结构来实现分布式机器学习过程,希望与大家一起学习进步~目录1.协同过滤参数2.交替最小二乘(ALS)3.Spark实现ALS原理...

2020-03-27 09:45:02 668

原创 Spark MLlib分布式机器学习源码分析:集成树模型

Spark是一个极为优秀的大数据框架,在大数据批处理上基本无人能敌,流处理上也有一席之地,机器学习则是当前正火热AI人工智能的驱动引擎,在大数据场景下如何发挥AI技术成为优秀的大数据挖掘工程师必备技能。本文结合机器学习思想与Spark框架代码结构来实现分布式机器学习过程,希望与大家一起学习进步~目录1.随机森林概念2随机森林参数3.随机森林实例4.随机森林源码5...

2020-03-26 14:57:39 704

转载 清洗数据,我习惯用这 7 步!

数据清洗 (data cleaning) 是机器学习和深度学习进入算法步前的一项重要任务,我平时比较习惯使用的 7 个步骤,总结如下:Step1 : r...

2020-03-25 21:00:00 481

原创 牛客SQL题解 - 查找所有员工入职时候的薪水情况

题目描述查找所有员工入职时候的薪水情况,给出emp_no以及salary, 并按照emp_no进行逆序CREATE TABLE `employees` (`emp_no` int(11) NOT NULL,`birth_date` date NOT NULL,`first_name` varchar(14) NOT NULL,`last_name` varchar(16) NOT N...

2020-03-25 16:38:38 331

原创 牛客SQL题解 - 查找所有员工的last_name和first_name以及对应部门编号dept_no

题目描述查找所有员工的last_name和first_name以及对应部门编号dept_no,也包括展示没有分配具体部门的员工CREATE TABLE `dept_emp` (`emp_no` int(11) NOT NULL,`dept_no` char(4) NOT NULL,`from_date` date NOT NULL,`to_date` date NOT NULL,P...

2020-03-25 16:35:31 503

原创 牛客SQL题解 - 查找所有已经分配部门的员工的last_name和first_name以及dept_no

题目描述查找所有已经分配部门的员工的last_name和first_name以及dept_noCREATE TABLE `dept_emp` (`emp_no` int(11) NOT NULL,`dept_no` char(4) NOT NULL,`from_date` date NOT NULL,`to_date` date NOT NULL,PRIMARY KEY (`emp...

2020-03-25 16:32:56 1626

原创 Spark MLlib分布式机器学习源码分析:决策树算法

Spark是一个极为优秀的大数据框架,在大数据批处理上基本无人能敌,流处理上也有一席之地,机器学习则是当前正火热AI人工智能的驱动引擎,在大数据场景下如何发挥AI技术成为优秀的大数据挖掘工程师必备技能。本文结合机器学习思想与Spark框架代码结构来实现分布式机器学习过程,希望与大家一起学习进步~目录1.决策树理论2.Spark实例3.源码分析 本文采用的...

2020-03-25 09:22:29 1473

转载 那些功能逆天,却鲜为人知的pandas骚操作

点击上方“Python数据科学”,星标公众号重磅干货,第一时间送达☞500g+超全学习资源免费领取文章来源:Python数据科学作者:东哥panda...

2020-03-24 21:05:55 660

原创 牛客SQL题解 - 查找当前薪水详情以及部门编号dept_no

题目描述查找各个部门当前(to_date='9999-01-01')领导当前薪水详情以及其对应部门编号dept_noCREATE TABLE `dept_manager` (`dept_no` char(4) NOT NULL,`emp_no` int(11) NOT NULL,`from_date` date NOT NULL,`to_date` date NOT NULL,PR...

2020-03-24 15:06:27 438

原创 牛客SQL题解 - 查找入职员工时间排名倒数第三的员工所有信息

题目描述查找入职员工时间排名倒数第三的员工所有信息CREATE TABLE `employees` (`emp_no` int(11) NOT NULL,`birth_date` date NOT NULL,`first_name` varchar(14) NOT NULL,`last_name` varchar(16) NOT NULL,`gender` char(1) NOT ...

2020-03-24 15:00:04 828

原创 牛客SQL题解 - 查找最晚入职员工的所有信息

题目描述查找最晚入职员工的所有信息CREATE TABLE `employees` (`emp_no` int(11) NOT NULL,`birth_date` date NOT NULL,`first_name` varchar(14) NOT NULL,`last_name` varchar(16) NOT NULL,`gender` char(1) NOT NULL,`h...

2020-03-24 14:55:19 442

转载 python爬取招聘网站数据,利用Tableau可视化交互大屏,指导你如何学习、找工作!...

↑关注 + 星标~有趣的不像个技术号每晚九点,我们准时相约大家好,我是黄同学交流群预热好久的可视化交互大屏来啦1、项目背景 随着科技的飞速发展...

2020-03-23 21:00:00 313 1

转载 python爬取招聘网站数据,利用Tableau可视化交互大屏,指导你如何学习、找工作!...

↑关注 + 星标~有趣的不像个技术号每晚九点,我们准时相约大家好,我是黄同学交流群预热好久的可视化交互大屏来啦1、项目背景 随着科技的飞速发展,数据呈现爆发式的增长,任何人都摆...

2020-03-23 21:00:00 398

原创 Python数据结构与算法:一文带你跨过“递归”门槛

注:今天博主开始更新数据结构与算法中的排序算法系列,使用Python语言实现,涉及基本数据结构、十大排序算法、递归分治、贪心动归等,意在帮大家更加容易的学习数据结构与算法以及进一步梳理这些知识点。目录递归的组成结构如何凑集一笔巨款用于公益事业?算法代码总结递归算法的执行斐波那契序列​算法代码跟踪递归函数的执行过程求斐波那契序列算法的时间复杂度利用递归...

2020-03-23 17:53:38 708

原创 Spark MLlib分布式机器学习源码分析:朴素贝叶斯

​ Spark是一个极为优秀的大数据框架,在大数据批处理上基本无人能敌,流处理上也有一席之地,机器学习则是当前正火热AI人工智能的驱动引擎,在大数据场景下如何发挥AI技术成为优秀的大数据挖掘工程师必备技能。本文结合机器学习思想与Spark框架代码结构来实现分布式机器学习过程,希望与大家一起学习进步~目录1.贝叶斯模型思想2.贝叶斯模型原理3.Spark实例4.源码分析...

2020-03-23 16:40:43 959

原创 Ubuntu启动谷歌浏览器Chrome时出现 "输入密码以解锁您的登陆密钥环"

问题出现原因Ubuntu安全自动给浏览器加入密码环问题解决方案方案一:直接取消密码环1.按下"win键"[就是上面一个windows标识的那个键],弹出个系统开始菜单界面(左上角的搜索菜单)2.搜索"密码",会自动过滤出"密钥和密码",英文是"password and keys",但都可以用英文进行搜索,点开即可.3.打开后应该有好几个密钥归类,默认应该有个"logi...

2020-03-23 16:35:39 10367 2

原创 别找了,这是python3网络爬虫从入门到进阶最详细的干货教程(附最强理论总结和五大代码案例)

历时数十天打磨,参考了诸多爬虫理论和实战资料,制作出爬虫从入门到进阶的详细纯干货教程,相信对于想学习爬虫的同学来讲是非常好的福利。此外更好的内容可以关注公众号“雨云飞”,笔者研究生即将毕业,签约BAT,后续会奉献更好的作品给大家~谢谢!目录Python网络爬虫数据采集实战:基础知识内容概要链接直达Python网络爬虫数据采集实战:Requests和Re库内容概要链接...

2020-03-22 19:28:10 2866 1

原创 Ubuntu19.10 MacOS主题安装优化教程(附资源下载)

有关Ubuntu19.10双系统的安装可参考下面博文:win10+ubuntu19.10双系统安装(最详细!附镜像资源+分区详解+实测教程)下面开始美化教程:先附上我优化之后的截图1.安装tweaksudo apt install gnome-tweak-tool2.主题下载在gnome look上下载主题鼠标主题和图标图为仿mac的主题MacOS-theme...

2020-03-22 17:43:14 1324

原创 Spark MLlib分布式机器学习源码分析:线性模型

​ Spark是一个极为优秀的大数据框架,在大数据批处理上基本无人能敌,流处理上也有一席之地,机器学习则是当前正火热AI人工智能的驱动引擎,在大数据场景下如何发挥AI技术成为优秀的大数据挖掘工程师必备技能。本文结合机器学习思想与Spark框架代码结构来实现分布式机器学习过程,希望与大家一起学习进步~目录1.数学公式2.线性回归3.逻辑回归4.线性支持向量机...

2020-03-22 13:24:12 726

原创 Ubuntu vscode运行python文件提示python: not found

问题出现原因Ubuntu默认Python版本已改为Python3,所以找不到python路径问题解决办法在终端中输入以下命令,给python创建软连接,指向python3.x,具体视自己Ubuntu python所带版本而定sudo ln -s /usr/bin/python3.7 /usr/bin/python之后就发现可以正常在vscode中运行python...

2020-03-22 12:17:22 4783

转载 一文带你打Kaggle!记一次美妙的数据分析之旅~

本项目基于Kaggle电影影评数据集,通过这个系列,你将学到如何进行数据探索性分析(EDA),学会使用数据分析利器pandas,会用绘图包pyechar...

2020-03-22 11:00:00 455

Python极详细思维导图PDF高清合辑

Python学习路线,各行业薪资调研,Python语言超十图吐血整理合辑,涵盖Python各类学习方向重点及Python语言核心基础讲解! 具体包含语言基础、数据类型、条件&循环、函数&模块、面向对象编程、文件对象、异常处理等等全部高细节内容

2023-03-12

《Python数据结构与算法》教程及代码

Python数据结构与算法教程及代码吐血整理! 算法(Algorithm)是指解题方案的准确而完整的描述,是一系列解决问题的清晰指令,算法代表着用系统的方法描述解决问题的策略机制。也就是说,能够对一定规范的输入,在有限时间内获得所要求的输出。 数据结构(Data Structures):是计算机存储和组织数据的一种方式,可以用来高效地处理数据。 举个例子:二分查找就是一个非常经典的算法,而二分查找经常需要作用在一个有序数组上。这里二分就是一种折半的算法思想, 而数组是我们最常用的一种数据结构,支持根据下标快速访问。很多算法需要特定的数据结构来实现,所以经常把它们放到一块讲。 实际上,在真正的项目开发中,大部分时间都是 从数据库取数据 -> 数据操作和结构化 -> 返回给前端,在数据操作过程中需要合理地抽象, 组织、处理数据,如果选用了错误的数据结构,就会造成代码运行低效。这也是我们需要学习算法和数据结构的原因。 本资源从深层原理入手,包含丰富实例100+,深入浅出展现面试所需知识点及考题和答案,同学们自主选择。

2020-02-26

COURSERA机器学习课笔记

COURSERA机器学习课笔记,非常全面 !可配合coursera视频一起用~特别棒的资料

2018-01-16

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除