自我增值·自我管理·自我提升·职场技能
文章平均质量分 76
CDA·数据分析师
分享数据分析和人工智能领域的干货或外文翻译,囊括数据挖掘、数据分析、大数据分析、机器学习、深度学习、神经网络、算法工程、AI科技。还有职场经验交流、时代热门资讯,以及人生的点点滴滴。望大家一起努力,成为更好的自己!
展开
-
数据库术语之初学者指南
CDA数据分析师 出品编辑:Mika各位小伙伴大家好!我是徐杨老师,做数据分析编写SQL是必不可少的一个步骤。所以为了完成理论准备,我们需要学习更多的数据库术语。举个例子,你发现最近你的商品突然爆款,卖得极好,短时间内一下子获得了超过1000万行的用户行为数据。而我们企业原有的系统只是把行为数据存到了一些表格中,面对这海量的数据显然表格是不够用的。那么该怎么办呢?这时你就需要一个数据库设计器,负责将数据组织成表,以及建立这些表之间的关系。并且这一步至关重要,因为如果数据库设计从一开始就不完美.原创 2022-05-11 11:11:14 · 349 阅读 · 0 评论 -
解读 | 数据人需要掌握的5个商业技能
CDA数据分析师 出品作者:徐杨老师编辑:Mika各位小伙伴大家好!我是徐杨老师,好久不见!今天给大家带来5个数据科学家需要的商业技能,聊聊商业与数据科学两者如何携手并进。这时候有同学想问了,数据科学家为什么要有商业基础呢?假如你是一位数据科学家,擅长数学和统计学,熟练使用SQL和Python,对数据清洗可视化、统计建模、机器和深度学习等也很有经验。但是offer却迟迟没到手,这是为什么呢?也许老板是这么想的:我需要的是一个可以将数据与商业结合的人,能解决复杂的数据问题,与管理层分享他的.原创 2022-05-09 13:46:40 · 1050 阅读 · 1 评论 -
求职宝典 | 数据人简历中最好做到这7点
CDA数据分析师 出品作者:Elad Cohen编译:Mika作为一家技术公司的副总裁,我在管理数据科学部门时,还需要处理大量的招聘工作。通常,招聘人员在一份简历上花的时间平均只有7.4秒。一个抢手的职位可能会吸引到一百余人投递简历。在本文中,我将教你几个技巧,帮助你在求职过程中让你的简历脱颖而出。下面我将分享一下,在快速筛选数据相关职位简历时,我最看重的这7点。01、以往的数据相关经验在浏览简历时,我会快速看看你以前的职位,看是否与数据挂钩,有数据相关工作经验。比如具体有数据相关项目的.原创 2022-01-24 09:56:31 · 2149 阅读 · 0 评论 -
盘点 | 2022值得学习的编程语言 TOP 7
CDA数据分析师 出品编译:Mika如果我们把人类文明想象成汽车的话,那么软件开发行业就相当于汽车的引擎,编程语言就像引擎的燃料。2021年很快就要结束了。如今,软件开发行业正以前所未有的速度在全球蓬勃发展。在不久的将来,该行业在全球收入预计将超过3000亿美元。在越来越多的行业,拥有数据思维能力,会编程语言也变得日益重要,能够编写计算机程序也成为了当下最值得学习的技能之一。在数字经济的新形势下,跟随技术潮流的发展来学习新技术是十分必要的。2022年,你有计划新学一门编程语言吗?在本文中我们列.原创 2021-12-27 15:56:57 · 11925 阅读 · 6 评论 -
矩阵分析法,做商业决策必备的经典分析思维
众所周知,无论是一个国家还是一个企业,在制定决策策略的时候,都不会询问每一个人的意见,对于国家而言,通常会收集各行各业代表的意见;对于企业而言,则是会选择一些有代表性的人员来进行意见调研。同理,当我们需要对大量数据进行分析时,是否一定要纳入很多变量来构建模型呢?比如逻辑回归模型可纳入的变量个数是比较少的,那么当变量个数成千上万时,还可以来构建逻辑回归模型吗?此时,就需要引入维度分析的思想。即选取一些重要维度中有代表性的变量来进行分析。比如某电信公司想要预测客户是否流失,而影响客户流失的维度有很多,比如.原创 2021-11-26 09:35:49 · 1548 阅读 · 0 评论 -
同样是大逃杀类影片,《鱿鱼游戏》凭什么能火遍全球?
CDA数据分析师 出品作者:Mika数据:Mika 曹鑫456人最终剩一人,每淘汰一人奖金增加一亿,给你这样的游戏,你参加不参加?这就是风靡全球的Netflix原创韩剧《鱿鱼游戏》。讲述一群在现实生活中负债累累的人们来参与游戏,最终的获胜者能够赢得456亿元奖金。如果要问这部影片目前到底有多火?从9月17日起一开播便一炮走红。夺下Netflix美国榜冠军。在世界各地的播放榜当中也排名第一,包括印度、澳大利亚、爱沙尼亚、巴西等190多个国家。同时《鱿鱼游戏》还在国内多次登上热搜榜,截至2021.原创 2021-11-08 09:52:34 · 3000 阅读 · 0 评论 -
大学读的文科/商科专业,如何转型数据分析师?
一、我是文科生,我数学不好互联网和移动互联网时代,程序员成了公认的高薪工作,是众多企业的抢手人才。但凡大学专业沾边计算机的理科生,都有机会去竞逐一下互联网大厂的高薪岗位。数据时代,数据人才就像之前的程序员成了企业的「香饽饽」,互联网大厂又开始招募大量数据岗位,根据《2020中国数字化人才现状与展望》报告显示,数据人才的需求在不断增加:数据人才的岗位薪资也高于普通白领平均薪资:面对这么大好的形势,这次难道没咱们文科生什么事情了吗?「我读的文科,我读的商科,我数学不好,我能学数据分析吗?」这也是我们原创 2021-09-26 15:48:18 · 427 阅读 · 0 评论 -
如何评估机器学习模型的商业价值
作者:amitvkulkarniCDA数据分析师编译概述对于任何评估来说,最难的是保持简单易操作,在数据科学中也是如此。在任何数据科学项目中,细化数据、微调模型、部署它们的迭代过程都是一个持续的过程。随着工具、算法的进步,以及随着 MLOps 的出现,事情变得容易了很多,而且未来也会继续发展——技术会优化自己。业务方面呢?说服客户相信使用先进工具和技术构建的复杂模型的预测能力有多容易?客户是否愿意为项目提供资金并信任我们模型的建议?好吧,不妨试着解释模型的 ROC 曲线,试着用特异性和敏感性指标来.原创 2021-09-22 14:01:09 · 392 阅读 · 0 评论 -
我成功转型大厂数据分析师后,总结了这些经验…
作者:大师兄本文为「心中有数」CDA征文作品大家好,作为一名CDA持证人,一晃我在数据分析行业已经做了几年了。作为一名电商行业的数据分析师,我时不时的想写一些个人的经验分享,但是又担心自己在这条路上走的还不够深入,所以一直没有下笔过。最近心态发生了一些变化,还是准备写一些东西,也当做对自己这几年的一些总结和思考。本篇文章主要分成三个部分:数据分析师转行的进阶之路数据分析师要掌握的必备技能简单的项目经验思路分享01、个人的成长经历初识:我是15年大学毕业,在学校学习了统计学、Excel、.原创 2021-09-18 11:03:25 · 569 阅读 · 0 评论 -
如何针对企业产品进行有效分析,看大佬用SQL分析淘宝用户行为
分析背景淘宝网,是全球最受欢迎的网购零售平台之一,拥有近5亿的注册用户数,每天有超过6千万的固定访客,同时每天的在线商品数已经超过了8亿件,平均每分钟售出4.8万件商品。作为电商行业的标杆,淘宝网的用户行为数据,一定程度上反映了用户的购买行为规律。本项目利用MySQL对淘宝用户行为数据进行分析,探索不同用户的消费习惯,结合店铺营销策略,以实现精准化运营,减少运营成本,增加店铺营收。分析目标与思路探索目标:每日不同时段流量走势,质量如何?用户行为转化情况怎样?如何提高留存、增加复购?如何判断高价值用原创 2021-09-08 13:51:20 · 290 阅读 · 0 评论 -
数据科学家的武器库(数理统计技术)
数理统计博大精深,分为频率和贝叶斯两大学派。不过作为面向商业运用的数据科学家,对入门级选手的数理统计要求并不高,只要具备文科高等数理统计的基础足矣,比如被广泛采用的《经济数学第三册》,或者任何一本商业统计学、社会统计学,教育统计学等教程。1.2.1描述性统计分析描述性分析是每个人都会使用的方法。比如新闻联播中每次提及人民的收入情况,报告的永远是均值,而不是一一念出每个人的收入。企业财务年报中经常提及的是年收入、利润总额,而不是每一笔交易的数据。这些平均数、总和就是统计量。描述性分析就是从总体数据中提炼变原创 2021-09-06 15:46:22 · 370 阅读 · 0 评论 -
太敢拍了!20万条弹幕告诉你,《扫黑风暴》为何能掀起收视热潮?
CDA数据分析师 出品作者:Mika数据:曹鑫2021年暑期档热度最高、最出圈的电视剧莫过于《扫黑风暴》了。这部扫黑题材的电视剧《扫黑风暴》一开播就火了。开播仅六小时播放量就过亿,截止到目前为止,单平台播放量超过20亿,豆瓣评分7.7分,以后超过18万人进行评分。《扫黑风暴》中性格饱满的人物、扑朔迷离的案情、演技爆棚的阵容、引人猜测的伏笔、寓意颇深的细节……每一项都让网友直呼 “过瘾” “上头”。在百度指数上可以看到,该剧的热度在8月9日刚播出时就不断上升,随着剧情深入热度持续升高,在8月2.原创 2021-09-03 15:51:04 · 713 阅读 · 0 评论 -
在谷歌、Facebook等顶级科技公司工作需要哪些技能
CDA数据分析师 出品作者: Lydia Dishman编译: MikaLinkedIn通过对用户数据的深入挖掘,列出了美国最具吸引力的40强企业。查看完整TOP40名单:https://lists.linkedin.com/2016/top-attractors/en/us前20名中只有可口可乐,Under Armour和Black Rock不属于科技行业。如今,许多企业都认为自己属于科技领域,比如高盛集团的CEO,他将这家金融公司称为科技公司。同时值得注意的是,编程已经成为各行各业最重要.原创 2021-09-02 16:20:39 · 240 阅读 · 0 评论 -
你会不会正在做无意义的数据分析?
你会不会正在做无意义的数据分析?并没有符合你的预期,活跃度?假设活跃度的口径,是用户当天用过登录app的记录问题1、登录app的用户真的就算是活跃了吗?问题2、后台记录的登录条件上是否有限制?push页进来的也算登录吗,还是一定要首页进来的?问题3、统计量下的活跃用户真的是有价值的客户,可以为后续的转化提供基础,没有噪声用户的吗?一、关于预警指标初认识1、常用的用户数据指标有哪些?理解“日活/月活度数据指标”-使用场景到底活跃对我们意味着什么?活跃用户,是相对于“流失用户”的一个概原创 2021-08-17 17:18:18 · 289 阅读 · 0 评论 -
只懂技术还不够,数据科学家还需掌握这五大商业技能
CDA数据分析师 出品编译:Mika【导读】数据科学家还需要掌握商业技能吗?当然了!在今天的内容中,我们谈谈商业和数据科学,以及如何将两者结合起来。有人可能会问,数据科学家的业务基础? 数据科学家为什么还需要这方面的技能?想象一下,你是一名数据科学家。你擅长数学和统计学,你能熟练使用SQL和Python,具有丰富的数据清理和可视化经验。另外,你对机器和深度学习也并不陌生。这在你看来,有了这些技能,任何高薪数据科学家工作都是你的囊中之物。也许你是一位经验丰富的数据科学家,正试图开辟新的领域.原创 2021-08-13 19:46:49 · 252 阅读 · 0 评论 -
如何才能快速废掉一个职场人,三样东西就够了
前段时间在网上看到了一个话题特别有意思,“废掉一个人最快的方式”。有人说是拖延症,也有人说是抱怨,还有人说是原地踏步。今天想和大家一起聊聊。在我进入互联网公司后,我的第一份工作是做竞价。记得当时我们部门有一位同事,刚刚大学毕业,98年的。他刚来上班的第一天就迟到了,接着连续迟到了4天,当时我们领导找他谈话,他说自己住的特别远,每天来回要四个小时。那次谈话后,他也确实改进了,没有再迟到过。我们都以为事情会随着好的方向发展,没想到一起工作半年后,他又开始迟到了,严重的时候一个月可以迟到8天。领导分配给他原创 2021-08-04 16:58:47 · 672 阅读 · 0 评论 -
不再枯燥!数据可视化是如何给报表“注入灵魂”的
CDA数据分析师 出品编译:Mika【导读】研究表明,帮助人们应对信息过载最基本的方法之一就是将其可视化。用外行的话来说,这意味着把数据画成图形,甚至用数据来创建交互式的图表。八秒钟,能做些什么?能给鞋系上鞋带;用八秒钟,比尔·盖茨能赚2000美元;八秒钟,也能让尤塞恩·博尔特跑一百米…同时,这也是人类平均注意力持续时间的长度。当涉及到玩枯燥的商业报告时,时间可能更短。如今有65%的人群都是视觉型学习者,因此立刻抓住大家的注意力在当下十分重要。(注:视觉型学习者通过“看”学得最好,他们.原创 2021-07-13 16:12:34 · 283 阅读 · 0 评论 -
数据解读:中国铁路百年发展史,从“追赶者”到领先世界
编辑:Mika数据:永洪科技【导读】回顾百年历史,中国铁路从开始的艰难曲折发展,到新中国成立后,在党的正确领导下,从设备落后、技术垄断到高速度高质量发展转变。截止2020年底,高铁运营里程达3.79万公里,稳居世界第一。翻开历史这本厚厚的书,看到了在峥嵘岁月中 中国背着我们一步步前行,历经几代人艰苦的奋斗,中国从“追赶者”变成“领跑者”。曾经的山河破碎,风雨飘摇,这100年来的中国到底做了什么 才完成这华丽的蜕变?铁路作为国家重要的基础性设施,国民经济的大动脉和百姓出行的交通工具,与民众有着不可.原创 2021-07-05 17:41:19 · 1106 阅读 · 0 评论 -
CDA LEVEL II考试内容公布,这些知识你掌握了吗
CDA LEVEL II新版考试大纲发布后,对于相关技能掌握程度的要求,也发生了改变。今天小编带着大家一起来看看更新后的考试大纲。一、总体目标CDA(Certified Data Analyst),即“CDA 数据分析师”,是在数字经济大背景和人工 智能时代趋势下,面向全行业的专业权威国际资格认证,旨在提升全民数字技能,助力企业 数字化转型,推动行业数字化发展。「CDA 人才考核标准」是面向全行业数据相关岗位的 一套科学化、专业化、国际化的人才技能准则,CDA 考试大纲规定并明确了数据分析师认 证考试原创 2021-04-02 16:12:20 · 607 阅读 · 0 评论 -
CDA LEVEL II分数占比解读,看懂这些,考试轻松拿分
CDA LEVEL II考试大纲已经公布,下面小编和大家一起来看看,改动后的考试大纲,分数占比有哪些变化。PART 1 数据采集与处理(占比 12%)a. 数据采集方法(占比 2%)b. 市场调研和数据录入 市场调研流程(占比 1%) 样本选取(占比 2%) 问卷设计及录入(占比 2%)c. 数据探索与可视化(占比 2%)d. 数据预处理方法(占比 3%)PART 2 数据模型管理(占比 3%)a. 数据分类(占比 1%)b. 关系模型(占比 1%)c. 数据仓库体系和 ETL(占比 1原创 2021-03-31 17:31:57 · 547 阅读 · 0 评论 -
数据分析师认证考试形式发布,如何掌握考试重难点?
大数据发展的同时,也给我们带来了新的机遇。随着数据价值越来越显著,以数据分析为基础形成了一个朝阳产业,受到各界人士青睐。无论是从国家发展的战略方向,还是就业市场的巨大规模导向,都揭示了数据分析师技能的重要性,这是一个跨时代的代表性技能。那么数据分析师考试采用什么形式呢?今天跟着小编的步伐一起来看看吧。标题考试形式考试方式:线下考试,上机答题考试题型:客观选择题(单选 80 题+多选 20 题+内容相关 20 题+ 案例分析 20 题)考试时间:120 分钟考试成绩:分为 A、B、C、D 四个原创 2021-03-29 13:49:27 · 254 阅读 · 0 评论 -
CDA LEVEL I分数占比解读,看懂这些,考试更容易拿分
在这个用数据说话的时代,可以说,未来商业发展中,没有一家公司不是数据公司。任何一家公司,都需要拥有驾驭数据的能力,学会用数据做精细化运营,利用数据驱动业务的增长。无论是从国家发展的战略方向,还是就业市场的巨大规模导向,都揭示了数据分析师技能的重要性,这是一个跨时代的代表性技能。为了让更多想要从事数据分析岗位的同学,能够尽快拿到认证证书。今天,特地为大家公布改版后的CDA LEVELⅠ考试分数占比,以便大家合理利用时间,考试时轻松应对,拿到更多的分数。PART 1 数据分析概述与职业操守(占比 3%)原创 2021-03-26 11:32:46 · 923 阅读 · 1 评论 -
想要月薪过万,如何选择适合自己的发展道路?
数据分析师最新薪资行情最近小编在网上看到很多小伙伴留言,问CDA数据分析师证书含金量高吗?企业认可吗?这里小编给大家介绍一下我们CDA数据分析师认证的相关情况。CDA考试是如何进行人才评定的呢?CDA考试成绩评定规则由CDA数据分析师认证考试命题委员会制定。每门考试最终成绩为A,B,C,D四个档,其中A,B,C为通过,D为不通过。考试结束后,CDA考试中心可提供成绩核查服务,不提供答题结果查询服务,不公布本届真题及答案。需要核实成绩的考生可在考试7日后登陆CDA考试中心,进入个人中心-成绩查询中核查原创 2021-03-24 14:39:59 · 244 阅读 · 0 评论 -
魔法数字是什么?如何用数据分析找到它
来源:接地气学堂作者:接地气的陈老师花里胡哨的新词,经常给同学们带来困扰。用户增长概念火了以后,随之而来的一个魔法数字,就搞糊涂了很多人。还闹出很多笑话,比如下边这个。请听题:某互联网公司toB业务的销售运营,发现了一个魔法数字:只要销售们打电话100次以上,通话100分钟以上,成交率就会明显飙升(如下图),于是销售运营制定了双100任务,要求人人每天达到这两个指标,还在电话间挂上了“只要没打死,就往死里打”的大标语。结果搞得销售们叫苦连天,疯狂加班,还屁业绩没有,离职率也上去...转载 2020-06-16 13:37:01 · 464 阅读 · 0 评论 -
基础知识普及:操作系统中的进程与线程!
操作系统是管理计算机硬件和软件资源的计算机程序,它管理计算机的内存分配,决定资源供需关系、控制输入输出设备以及提供用户和系统交互的操作界面简单的概括一下,操作系统就是一个管理硬件、提供用户交互的软件系统二. 操作系统的历程1. 无操作系统时代:人工操作、cup等待人工操作、资源利用率低2. 批处理系统时代:cpu无需等待人工操作、批量输入任务、资源利用率提升、多道程序设计3. 分时系统时代:多用户共享、可调试程序、资源利用率大幅提升三. 操作系统的基本功能1...原创 2020-06-16 11:41:13 · 316 阅读 · 0 评论 -
地摊经济能火?别傻了,北上广不相信眼泪!
2020年,一场突如其来的疫情,减缓了中国各大城市经济的发展。随着疫情防控等级逐步下降,为拉动经济,各地纷纷出台不同政策。3月,成都允许商户在规定区域内临时占道经营,刹那间烧烤摊、服装摊、小商品摊……风靡全城。2个月后公布战果,成都中心城区餐饮店复工率超98%,解决10万人就业问题,城市活力回来了。于是乎,“地摊经济”跻身网络热词,大家茶余饭后争相谈论,更出现了很多互联网人转战摆地摊的段子。现任某公司数据分析岗的小刘也心动了,不惜动用专业数据知识,去分析卖什么东西更挣钱,跃跃欲试,准备弄原创 2020-06-12 13:51:52 · 523 阅读 · 0 评论 -
Python是啥?竟然彻底改变了老板对我的看法……
朋友小红在某公司做策划,前段时间高层打算引进一个大项目,需要他做一份详细的报告,作为决策层的依据。雷厉风行的小红说干就干,然而,实际操作中才逐渐发现,公司购买的数据库,不仅乱、杂、多,还缺……“策划改了几十遍,现在只要看到数据,就反射性想吐……”他抓狂的说。千辛万苦做出了一版满意的,却被老板从头到尾diss了一番。如:方案太传统,严重缺乏互动性;视觉冲击力不够,没抓住大众需求;考虑的因素不够全面……最后一句话,重新做!被全盘否定了劳动成果的小红,整...原创 2020-06-02 10:33:16 · 285 阅读 · 0 评论 -
增长黑客:如何用户留存?
这节我们来聊一下用户留存的话题,用户留存有多重要呢?“不留存,就去死”,听起来还是有点耸人听闻的对吧。在一节的时候小P介绍过,很多大佬们往往更关注留存这一环节,那么这一环节有什么奇妙的地方呢?由于这一章内容较多,小P给大家找到了思维导图方便大家理解:首先,书中关于用户留存举了BranchOut的反例:从2012年1月开始,短短几个月时间里,BranchOut的总用户数增长到2500万,月活跃用户一度达到1400万,并且完成了C轮融资。就是这样一个看起来前景一片大好的社交网站,是怎么最后沦落到到处找买原创 2020-05-30 15:29:25 · 408 阅读 · 0 评论 -
hadoop:伪分布模式参数配置指南!
Hadoop通过改变其配置文件来更改运行模式,我们通过修改如下四个配置文件core-site.xml、hdfs-site.xml、mapred-site.xml和yarn-site.xml即可让Hadoop以伪分布模式运行。Hadoop的配置文件是 xml 格式,每个配置以声明 property 的 name 和 value的方式来实现。接下来让我们开始进行hadoop的配置吧,配置之前首先启动Ubuntu虚拟机,然后打开Xshell软件并连接登录虚拟机。1、设置hadoop-env.sh配置文原创 2020-05-30 15:10:46 · 312 阅读 · 0 评论 -
增长黑客:如何绘制用户的旅程?
第一节说到了比较重要的北极星指标,这也是我们增长团队打造增长模型的第一步。那么第二步就是绘制用户旅程,简单来说就是针对你所设定的北极星指标所代表的用户状态,一步一步地将用户旅程绘制出来。举例来说,对于电商产品,如果北极星指标是“销售额”,那么一个访客需要经过:1.访问电商网站;2.注册账户;3.第一次买东西;4.重复性购买这四步才能到达“产生销售额”的状态。将用户旅程绘制完成之后,就到达我们的最后一步——组装增长模型。同样拿电商产品举例,北极星指标如果是“销售额”,那么销售额=新原创 2020-05-29 13:40:56 · 534 阅读 · 0 评论 -
增长黑客:要如何引导用户激活?
接着上文我们来聊一下“用户激活”这个话题,提到用户激活,相信很多同学脑海都浮现一个词,没错,就是“Aha”时刻,用户激活是离不开Aha时刻的。如何定义它呢?Aha(惊喜)时刻,就是新用户第一次认识到产品的价值,从而脱口说出“啊哈,原来这个产品可以帮我做这个啊”的那个时刻。这是一个至关重要的时刻,他区分了那些从产品中发现了价值和那些没发现价值的用户。这也是一个“有感情”的时刻,用户觉得他从广告里看到的那些承诺,产品在这一刻都履行了,因此觉得满足甚至感到惊喜。在这里给大家列举了几个知名产品的Aha时原创 2020-05-29 10:52:58 · 407 阅读 · 0 评论 -
Python可视化:matplotlib的坐标轴和rc参数设置指南!
设置坐标轴 还记得上次画的那条“项链”嘛?结尾的时候有说过,这些是新手村礼包,还有很多其他值得探索的地方呢,那么就一起来康康还有哪些意想不到的操作吧(包括但不限于折线图哦,很多操作再其他图中也是可以运用哒!)当我看到这样一副图的时候,心里有点点疑问,貌似和手绘的图有点不一样啊,到底哪里不一样呢,来个对比看一下。这是matplotlib绘制的y = x^2:这是本人亲手绘制的y = x^2:(本灵魂画手已上线,非战斗人员请撤离!不要太在意细节哈,忽视那个长的不太协调的x轴和弯弯曲曲如蚯蚓的抛物线原创 2020-05-28 10:41:55 · 860 阅读 · 0 评论 -
增长黑客:如何打造高效运转的增长引擎?
说到组建增长团队,不同发展阶段的公司组建有所不同,拿一个小型创业企业来说。他的目标是成立一个1-3人的“最小化可行性”增长团队,开始增长实验。他的挑战是:资源有限、人员有限,不知如何下手。那他成功的关键在于:最大化利用现有资源,尽快开始做增长试验。这个时候女主在书中给到的建议是:如果有产品或市场背景,可以由CEO牵头再加上现有的程序员和设计师资源,成立一个“机动”的增长团队。在这种配置下,CEO需要在核心产品增长实验之间统一分配资源。什么意思呢?我们前面说过,好的产品必不可少,在这里强调的是——boss原创 2020-05-28 09:45:56 · 446 阅读 · 0 评论 -
python可视化:matplotlib绘制直方图进阶篇!
在上篇文章中介绍了直方图的前五个参数,实际上直方图一共有十几个参数,剩下的参数利用这篇文章解释清楚,让大家能够将如何绘制直方图理解的透透的。bottom参数这个参数的含义也很直观,底部的意思,指的是条形的底从哪里开始。这个参数接收标量和序列,或者None,默认为None,如果是标量,则所有条形的底都从同一个数值处开始,如果为序列,则可以指定每个条形的底不一致。fig = plt.figure(figsize=(16,4))pic1 = fig.add_subplot(131)plt.hist(d原创 2020-05-27 10:18:05 · 383 阅读 · 0 评论 -
hadoop:伪分布模式启动步骤分解!
1、格式化HDFS在运行伪分布式前,需先对NameNode进行格式化,在命令行中输入hdfs namenode -format # 格式化hdfs若出现successfully formatted字样,则说明格式化成功2、启动hadoop然后启动hadoop集群start-all.sh # 一次性启动所有服务或使用以下命令单独启动各项服务start-dfs.sh #启动hdfsstart-yarn.sh #启动mapredu...原创 2020-05-27 09:48:00 · 657 阅读 · 0 评论 -
Hbase:安装及模式配置指南!
所谓知己知彼,百战不殆!在安装HBASE前,我们需要了解它的版本,从而好进行选择与下载。通过之前介绍的Hbase的集群架构,我们可以知道Hbase数据需要存储在HDFS上,因此在选择Hbase版本时要兼顾之前安装的Hadoop版本。Hbase各个版本与Hadoop各个版本之间的兼容性可以从Hbase官网上得到,如下图所示:我们之前安装的是Hadoop2.7.5这个版本的hadoop支持的Hbase版本是最多的,支持上图中所有的Hbase版本。目前Hbase1.3.2使用比较广泛所以我们选择此版。原创 2020-05-27 09:31:45 · 312 阅读 · 0 评论 -
你了解matplotlib吗?直方图基础篇
首先按照惯例先来认识下直方图是谁,以下是从维基百科搬运过来的直方图的定义: 在统计学中,直方图(英语:Histogram)是一种对数据分布情况的图形表示,是一种二维统计图表,它的两个坐标分别是统计样本和该样本对应的某个属性的度量,以长条图(bar)的形式具体表现。因为直方图的长度及宽度很适合用来表现数量上的变化,所以较容易解读差异小的数值。直方图也是用条形进行标注的,而条形图和直方图犹如孪生兄弟般让很多人都傻傻分不清,那么我们就先来好好区分一下这两种图形吧:条形图是用条形的长度表示各类别频数原创 2020-05-26 13:54:56 · 599 阅读 · 0 评论 -
基于Python图表绘图系统:matplotlib散点图和气泡图,你了解吗?
惯例先来简单介绍下什么是散点图:用两组数据构成多个坐标点,考察坐标点的分布,判断两变量之间是否存在某种关联或总结坐标点的分布模式。散点图将序列显示为一组点。值由点在图表中的位置表示。类别由图表中的不同标记表示。(来源:百度百科) 散点图很主要的是可以很直观的查看两组数据之间的关系,另外还可以很显示数据的分布情况。干巴巴的描述来描述去也没有一个图来的直观容易理解:例如这张图,x轴数据和y轴数据就存在很强的正向关!而这幅散点图,显示数据分布,对于分类有很大的帮助。绘制简单散点图 既然已经知原创 2020-05-22 13:29:19 · 796 阅读 · 0 评论 -
数据处理:销售业绩分箱工具,pd.cut() Vs pd.qcut()
相信很多进行数据处理工作的小伙伴都遇到过这种需求,比如已经有了各个销售员的销售业绩,现在需要给各个销售业绩进行一个分档,诸如未完成任务,完成任务,超额完成任务等。要完成分档需要先对销售业绩的数值进行判断,然后再根据判断的结果进行一个分类,那么大家都是怎样进行分类的呢? 实际上,上述需求是要对连续型的数值进行分箱操作,实现的方法有N种,但是效率有高有低,这里我们介绍两种效率比较高而且也容易理解的方法。方法一:pd.cut()参数介绍先来看一下这个函数都包含有哪些参数,主要参数的含义与作用都是什.原创 2020-05-22 11:54:33 · 582 阅读 · 0 评论 -
matplotlib中简单条形图,你了解吗?
条形图是数据可视化图形中很基础也很常用的一种图,简单解释下:条形图也叫长条图(英语:bar chart),亦称条图(英语:bar graph)、条状图、棒形图、柱状图、条形图表,是一种以长方形的长度为变量的统计图表。长条图用来比较两个或以上的价值(不同时间或者不同条件),只有一个变量,通常利用于较小的数据集分析。长条图亦可横向排列,或用多维方式表达。那么一个普通的条形图是长什么样子的呢?当!当!当!就是下图的这个样子: 图先亮出来啦,接下来研究这个图是怎么画的吧,先看一下原数据长什么样子:原创 2020-05-22 09:48:36 · 483 阅读 · 0 评论