自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

CDA数据分析师

专注数据科学教育16年专业品牌

原创 拒绝目光短浅来造业,马斯克认为这些东西比钱更重要!

近日,马斯克旗下SpaceX公司成功完成了第一个载人航天任务,通过载人龙飞船把2名美国国家航空航天局(NASA)宇航员送往了国际空间站。 这是太空商业化进程的一个里程碑,虽是意料之中的事情,但面对测试中屡次爆炸的情况,SpaceX领头人埃隆·马斯克一直受到四面八方的质疑声,却丝毫未影...

2020-06-03 10:44:24 45 0

原创 加快Python算法的四个方法:Dask篇

image CDA数据分析师 出品 相信大家在做一些算法经常会被庞大的数据量所造成的超多计算量需要的时间而折磨的痛苦不已,接下来我们围绕四个方法来帮助大家加快一下Python的计算时间,减少大家在算法上的等待时间。今天给大家讲述最后一方面的内容,关于Dask的方法运用。 1.简介 随着对机器...

2020-06-03 10:25:50 23 0

原创 加快Python算法的四个方法:数据并行化篇!

4.jpeg CDA数据分析师 出品 相信大家在做一些算法经常会被庞大的数据量所造成的超多计算量需要的时间而折磨的痛苦不已,接下来我们围绕四个方法来帮助大家加快一下Python的计算时间,减少大家在算法上的等待时间。以下给大家讲解关于数据并行化这方面的内容。 1.介绍 随着时间和处理器计算能...

2020-06-03 10:18:52 71 0

原创 加快Python算法的四个方法:Numba篇

image CDA数据分析师 出品 相信大家在做一些算法经常会被庞大的数据量所造成的超多计算量需要的时间而折磨的痛苦不已,接下来我们围绕四个方法来帮助大家加快一下Python的计算时间,减少大家在算法上的等待时间。今天给大家介绍Numba这一块的内容。 1.简介 所以什么是Numba呢?Nu...

2020-06-03 10:11:17 22 0

原创 加快Python算法的四个方法:PyTorch

1.png 相信大家在做一些算法经常会被庞大的数据量所造成的超多计算量需要的时间而折磨的痛苦不已,接下来我们围绕四个方法来帮助大家加快一下Python的计算时间,减少大家在算法上的等待时间 1.介绍: 在PyTorch模块中,我将展示如何使用torch和检查、初始化GPU设备pycuda,以及如...

2020-06-03 09:39:20 7 0

翻译 零售中的机器视觉–当前实例和应用

零售业每天收集大量数据,这使其关键流程变得成熟,可以通过机器学习实现自动化。与制造业一起,零售业可能会在未来几年中受益于一种特定的AI技术:机器视觉,也称为计算机视觉。 机器视觉使计算机能够“识别”图像和视频中的对象。借助安全,购物,驾驶等应用程序,普通人可能会熟悉机器视觉用例,例如店内摄像头,...

2020-06-02 11:43:15 110 0

翻译 睡眠研究可以帮助创建更好的AI模型吗?

我们为什么要睡觉?一个明显的原因是恢复我们身体和四肢的力量。但是睡眠的另一个非常重要的作用是巩固记忆并组织清醒时大脑摄入的所有信息。缺乏适当睡眠的人会认知能力下降,记忆力下降。 睡眠的奇观和奥秘仍然是研究的活跃领域。除了医学,心理学和神经科学外,睡眠研究还可以用于其他科学领域。人工智能研究人员也在...

2020-06-02 11:33:27 197 0

翻译 聊天机器人:电子商务的下一代技术

图片来源:Depositphotos 最近,很多组织出于增强客户体验,简化流程以及推动对数字和创新技术的需求,相互竞争以实现聊天机器人。诸如聊天机器人之类的认知技术已经融入生活的各个方面,因为它们具有高度的自动化可行性,较高的准确性潜力,较低的复杂性和执行时间。 移动智能技术的发展,已经推动了虚拟...

2020-06-02 11:25:09 188 0

转载 数据分析,这样满足运营的需求(实操版)

来源:接地气学堂 作者:接地气的陈老师 很多做数据的同学,最怕听“有用”俩字。做个数据分析项目已经很难了。做个有用的项目更难。今天我们举个场景,手把手教一下该咋弄。 请听题:某短视频平台,游戏直播业务的日活用户1000万左右,但90%观看时间不足10分钟,运营希望尽可能多的让用户观看...

2020-06-02 10:48:13 173 0

原创 Python是啥?竟然彻底改变了老板对我的看法……

朋友小红在某公司做策划,前段时间高层打算引进一个大项目,需要他做一份详细的报告,作为决策层的依据。 ​ 雷厉风行的小红说干就干,然而,实际操作中才逐渐发现,公司购买的数据库,不仅乱、杂、多,还缺…… “策划改了几十遍,现在只要看到数据,就反射性想吐……”他抓狂的说。 千辛万...

2020-06-02 10:33:16 29 0

翻译 人工智能适合教育的地方!

人工智能即将用于教育。但是不要惊慌。据我们所知,它不会取代大学的教师或教学。这不是滑坡。取而代之的是,人工智能将赋予教师超能力,扩大其影响范围并延长其时间。 一个好的老师是一个榜样,一个圣人,能够成为学生所需要的。教学太个人化,太人性化了,无法转向AI。 这不只是我的意见。三年前,全球咨询公司...

2020-06-01 13:57:09 261 0

原创 为什么商界大佬潘石屹也在学,网友:TA魅力有这么大?

56岁生日当天,房地产大佬、SOHO中国董事长潘石屹发布了一条微博,表示自己要开始学Python。 很多人以为他只是开玩笑,然而潘石屹本人并不这样认为,至此以后,潘石屹的个人微博时不时会晒出一些Python学习的内容。 为了表明自己的决心,潘石屹还专门设立了一个叫#潘石屹用pyth...

2020-06-01 11:27:07 151 0

原创 不仅仅是玩具,Python带你解读不一样的乐高

CDA数据分析师 出品 作者:Mika、泽龙 数据:真达 后期:泽龙 【导语】:今天我们来聊聊小朋友和大朋友们都爱不释手的乐高,Python技术部分请看第四部分。Show me data,用数据说话! 六一儿童节到了,过节的不仅仅是儿童,还有很多不想长大的成年人。然而,儿童游乐场...

2020-06-01 11:13:24 165 0

原创 仅拍125个视频就成为千万级网红? 数据告诉你李子柒怎么做到的?

CDA数据分析师 出品 作者:Mika 数据:真达 后期:Mika、泽龙 【导语】:今天我们来聊聊把生活过成诗的李子柒。Python技术部分请看第二部分。Show me data,用数据说话。 “李家有女,人称子柒。”如果说到当下最火的网红,想必很多人都会想到李子柒。日出而作,日...

2020-06-01 10:52:49 165 0

原创 增长黑客:如何用户留存?

这节我们来聊一下用户留存的话题,用户留存有多重要呢?“不留存,就去死”,听起来还是有点耸人听闻的对吧。在一节的时候小P介绍过,很多大佬们往往更关注留存这一环节,那么这一环节有什么奇妙的地方呢?由于这一章内容较多,小P给大家找到了思维导图方便大家理解: 首先,书中关于用户留存举了BranchO...

2020-05-30 15:29:25 159 0

原创 hadoop:伪分布模式环境变量的配置 !

单节点集群模式(a Single Node Cluster)又称伪分布模式,只需一个节点即可运行。这种模式一般只是用来学习或者开发、测试使用。实际使用中还是使用多节点的分布式。 1、环境变量配置 为了方便的执行Hadoop程序,需要配置很多系统环境变量。主要有以下几个变量 设置HADOOP...

2020-05-30 15:21:43 159 0

原创 hadoop:伪分布模式参数配置指南!

Hadoop通过改变其配置文件来更改运行模式,我们通过修改如下四个配置文件core-site.xml、hdfs-site.xml、mapred-site.xml和yarn-site.xml即可让Hadoop以伪分布模式运行。 Hadoop的配置文件是 xml 格式,每个配置以声明 propert...

2020-05-30 15:10:46 84 0

原创 增长黑客:如何绘制用户的旅程?

第一节说到了比较重要的北极星指标,这也是我们增长团队打造增长模型的第一步。那么第二步就是绘制用户旅程,简单来说就是针对你所设定的北极星指标所代表的用户状态,一步一步地将用户旅程绘制出来。 举例来说,对于电商产品,如果北极星指标是“销售额”,那么一个访客需要经过: 1.访问电商网站; 2.注册...

2020-05-29 13:40:56 155 0

原创 增长黑客:要如何引导用户激活?

接着上文我们来聊一下“用户激活”这个话题,提到用户激活,相信很多同学脑海都浮现一个词,没错,就是“Aha”时刻,用户激活是离不开Aha时刻的。 如何定义它呢?Aha(惊喜)时刻,就是新用户第一次认识到产品的价值,从而脱口说出“啊哈,原来这个产品可以帮我做这个啊”的那个时刻。 这是一个至关重要的...

2020-05-29 10:52:58 165 0

原创 大数据工具:Zookeeper的安装宝典!

之前介绍了Hbase本地单节点模式的安装,该模式资源占用少适合学习使用。但是在生产环境中为了保证数据的安全,普遍采用集群模式来运用Hbase。在集群模式下Hbase的数据存储在HDFS文件系统而非本地文件系统,还需配以zookeeper集群来提供协调一致性服务。我们先来安装zookeeper然后再...

2020-05-29 10:41:05 106 0

原创 hadoop:集群网络介绍,及相关文件配置指南!

上篇文章中我们已经将之前配置好的伪分布集群虚拟机复制出来做为master节点的虚拟机,接下来我们还需对该虚拟机做进一步的配置来达到我们的要求。对master虚拟机的配置将从网络、hostname、更改Hadoop相关配置等几方面展开。 1、网络配置 目前虚拟机网卡IP地址为自动获取模式。也就是...

2020-05-29 10:29:23 34 0

原创 7本有关Python的经典好书推荐,适合各类人群

Python越来越受到各行业从业者的关注,成为职场人士极为关注的职业提升技能,为了解答很多初学者的问题,今天特别给大家推荐9本有关Python的书籍,大家有兴趣可以看看哦! 1、基础书籍:《Python编程》 豆瓣评分:9.1分 推荐指数:★★★★★ 推荐理由:架构非常漂亮...

2020-05-28 12:15:15 46 0

原创 Python可视化:matplotlib的坐标轴和rc参数设置指南!

设置坐标轴 ​ 还记得上次画的那条“项链”嘛?结尾的时候有说过,这些是新手村礼包,还有很多其他值得探索的地方呢,那么就一起来康康还有哪些意想不到的操作吧(包括但不限于折线图哦,很多操作再其他图中也是可以运用哒!) 当我看到这样一副图的时候,心里有点点疑问,貌似和手绘的图有点不一样啊,到底哪里不一样...

2020-05-28 10:41:55 65 0

原创 大数据时代:SSH如何免密码登录?

Hadoop集群是由许多的节点服务器组成的,当我们启动hadoop集群时,hadoop的Namenode需要连接并且管理这些节点服务器(主要是DataNode)。 此时系统会要求用户输入密码,提示内容与上篇文章中的ssh连接localhost时的提示是一样的,这从侧面说明Hadoop的Namen...

2020-05-28 10:23:14 227 0

原创 hadoop:分布式集群,初次启动!

上篇文章中我们通过克隆已有虚拟机并修改相应的参数配置将hadoop分布式集群搭建完成,接下来我们启动Hadoop分布式集群。 1、ssh免密登录 首先打开虚拟机软件VMware然后开启master、slave1、slave2三个虚拟机。 一般搭建hadoop分布式集群时需要配置集群中各个节点...

2020-05-28 10:09:49 138 0

原创 增长黑客:如何打造高效运转的增长引擎?

说到组建增长团队,不同发展阶段的公司组建有所不同,拿一个小型创业企业来说。他的目标是成立一个1-3人的“最小化可行性”增长团队,开始增长实验。他的挑战是:资源有限、人员有限,不知如何下手。那他成功的关键在于:最大化利用现有资源,尽快开始做增长试验。这个时候女主在书中给到的建议是:如果有产品或市场背...

2020-05-28 09:45:56 182 0

原创 42岁的刘涛直播倒立,对自己狠的人才能活出人生新高度!

影视寒冬来临,明星纷纷转战综艺或直播,以演技和敬业著称的刘涛也加入了阿里,取名“刘一刀”,正式开启了直播带货生涯。 首次直播,刘涛促成交易总额超1.48亿元,光补货就达20多次,观看人次达2100万。不得不说,刘涛带货的能力较之李佳琦有过之而无不及。 近日,42岁刘涛因直播倒立...

2020-05-27 10:31:29 239 0

原创 python可视化:matplotlib绘制直方图进阶篇!

在上篇文章中介绍了直方图的前五个参数,实际上直方图一共有十几个参数,剩下的参数利用这篇文章解释清楚,让大家能够将如何绘制直方图理解的透透的。 bottom参数 这个参数的含义也很直观,底部的意思,指的是条形的底从哪里开始。这个参数接收标量和序列,或者None,默认为None,如果是标量,则所有条形...

2020-05-27 10:18:05 27 0

原创 hadoop:分布式集群参数master节点的配置!

之前的文章中我们已经将master节点的网络IP、hostname文件、hosts文件配置完成,接下来还有hadoop相关配置文件需要修改。今天我们来讲master节点hadoop的配置。 1、hdfs-site.xml 在hadoop的配置文件中与HDFS(hadoop分布式文件系统)相...

2020-05-27 10:05:53 169 0

原创 hadoop:伪分布模式启动步骤分解!

1、格式化HDFS 在运行伪分布式前,需先对NameNode进行格式化,在命令行中输入 hdfs namenode -format # 格式化hdfs 若出现successfully formatted字样,则说明格式化成功 2、启动hadoop 然后启动hadoop集群 st...

2020-05-27 09:48:00 128 0

原创 Hbase:安装及模式配置指南!

所谓知己知彼,百战不殆!在安装HBASE前,我们需要了解它的版本,从而好进行选择与下载。 通过之前介绍的Hbase的集群架构,我们可以知道Hbase数据需要存储在HDFS上,因此在选择Hbase版本时要兼顾之前安装的Hadoop版本。Hbase各个版本与Hadoop各个版本之间的兼容性可以从Hb...

2020-05-27 09:31:45 103 0

原创 大数据:hadoop多节点集群搭建指南!

1、多节点集群架构设计 后续介绍的hadoop多节点集群由三台计算机构成:一台主节点为master,两台从节点为slave1、slave2。 master节点上主要运行namenode、Resourcemanager进程;slave节点上运行datanode、nodemanager进程。 ...

2020-05-26 14:14:19 35 0

原创 你了解matplotlib吗?直方图基础篇

​ 首先按照惯例先来认识下直方图是谁,以下是从维基百科搬运过来的直方图的定义: ​ 在统计学中,直方图(英语:Histogram)是一种对数据分布情况的图形表示,是一种二维统计图表,它的两个坐标分别是统计样本和该样本对应的某个属性的度量,以长条图(bar)的形式具体表现。因为直方图的长度及宽度很适...

2020-05-26 13:54:56 124 0

原创 Spark:安装及环境配置指南!

前篇文章介绍了scala的安装与配置、接下来介绍一下spark的安装及环境配置。 1、Apache spark下载 在浏览器输入网址https://spark.apache.org/downloads.html进入spark的下载页面,如下图所示: 下载时...

2020-05-26 13:33:34 66 0

原创 Python告诉你:从《入海》到《消愁》毛不易的歌里都在唱些什么?

【导语】:今天我们来聊聊——B站联合毛不易发布的毕业季主题曲《入海》,以及背后不一样的毛不易。Python技术部分请看第三部分。 Show me data,用数据说话!今天我们聊一聊 毛不易的《入海》,没错,还是那个B站,在520这个既浪漫且有营销价值的一天又「搞事情」了。 5月20日...

2020-05-26 11:46:28 167 0

原创 口红?剃须刀?Python告诉你,刚过去的520,大家都在送什么礼物

【导语】:今天我们来聊一聊刚过去的520,大家买得最多的都是什么?Python技术部分请看第二部分。 Show me data,用数据说话!今天我们聊一聊 520的礼物,一年一度的520刚刚过去,由于受疫情影响错过了今年的2月14日情人节,2020年5月20日,这个谐音为“爱你爱你我爱你”的 “世...

2020-05-26 11:30:00 202 0

原创 EXCEL知识:数组运算是什么?

​ 对于Excel中的“数组”,我在最开始接触的时候觉得很难,理解不了它的原理。虽然会用数组写出来,但是很多时候完全不理解为什么要那样写。后来我看了一些资料,然后重复听老师讲课,最后慢慢理解了。到现在也有几个月的时间没有再看,但是最近做了一些有关数组方面的例题,发现很多以前无法理解的问...

2020-05-25 13:20:12 130 0

原创 见识matplotlib:不常见的一面,折线图!

​ 江湖上所公认的一句话,字不如表,表不如图!人们往往都更喜欢看图说话,那么用python的各位大侠们,大家都在用什么画图呢?各种各样的画图包犹如各式各样的兵器,有的兵器功能单一但是在细分领域超级专业无敌,有的兵器功能多而全,用法灵活。 ​ 众所周知,matplotlib是python绘图的基础包...

2020-05-25 11:31:33 118 0

原创 未来10年最具潜力的行业已出现,你一定不能错过?

已经退居幕后的马云,因宣布“6月25日将辞去软银董事职务“”一事,而再次进入大众的眼帘,成为老百姓热议的人物。 马云是个传奇的人物,比起商场,他更偏爱公益和教育,并自称马老师。但他敢于创新,引领阿里巴巴“一路高歌”,创造了一个又一个的销售“票房奇迹”,不得不说马老师的商业洞察力十分敏锐。 ...

2020-05-25 11:03:56 204 0

原创 Spark集群:环境搭建之Scala安装指南!

前篇文章介绍了Spark计算框架相较于MapReduce框架的种种优势,接下来我们一起安装、配置Spark集群环境,方便后期继续学习研究。Spark项目是由Scala语言编写的,因此需提前配置Scala环境才能运行Spark程序。 1、Scala版本选择与下载 我们安装spark2.1.2版本...

2020-05-25 10:43:01 99 0

提示
确定要删除当前文章?
取消 删除