数据分析
文章平均质量分 93
办公模板库 素材蛙
命数如织 当为磐石
展开
-
数据挖掘思维和实战24 实践 5:使用 fatText 进行新闻文本分类
至此呢,我们最后一节实践课就讲完了。这一课时,我们以一个多层级的新闻文本分类为背景,先简单介绍了 fastText 模型;然后介绍了一种使用 fastText 来进行分类的简单案例;最后,我们引入了在实际的大型项目中,到底是如何进行多级分类的流程。可以看到,在这个过程中,算法只是其中的一个环节,要想具体地解决业务中的实际问题,我们还需要做很多很多的工作。在写作的过程中,由于各种各样的因素,内容难免存在一些错误和疏漏,如果你发现了问题,欢迎及时批评与指正。原创 2022-10-09 21:40:26 · 753 阅读 · 0 评论 -
数据挖掘思维和实战23 word2vec:让文字可以进行逻辑运算,女人+王冠=女王
看完了代码部分,这节课又将告一段落了。这是我们关于自然语言处理的第二节课程,当然这两节课程只是介绍了自然语言处理浩如烟海的知识中很小的一部分,但是我希望通过这两小节课程的学习,你能够对自然语言处理有一个初步的了解。在这节课里面,我们介绍了 Word2Vec 算法,从原来的 OneHot 编码讲起,到 Word2Vec 的基本原理以及 Word2Vec 的两种工作模式。不过,这里所介绍的都是最浅显的部分,关于 Word2Vec 算法还有很多的细节我们没有涉及。原创 2022-10-09 21:38:18 · 318 阅读 · 0 评论 -
数据挖掘思维和实战22 TF-IDF:一种简单、古老,但有用的关键词提取技术
这一小节,我们开始涉及了一点关于自然语言处理的知识。我在这一小节讲解了一个比较古老,但是很实用的关键词提取算法 TF-IDF,它的原理十分简单、易于理解,通过 TF-IDF 的计算,保留了那些出现频率高的词汇,同时又能够打压那些比较普通的词汇,即便是现在,这个算法仍然有比较广泛的应用。下一小节,我们将讲一下更加前沿的词嵌入技术“Word2Vec”算法。原创 2022-10-09 21:37:06 · 752 阅读 · 0 评论 -
数据挖掘思维和实战21 实践 4:用关联分析找到景点与玩法的关系
这一小节讲到这里就告一段落了,这节课里面没有涉及任何代码,而是主要从整个业务流程上讲解了具体去做一个关联分析项目的过程。我们从提出去寻找景点与玩法的业务需求开始,深入理解了我们的业务与数据情况,接下来是制定我们的方案并实施。关联分析的方案几乎是基于统计来进行计算,所用到的方法通常都非常简单,只要我们解决了工程性的问题就不会有太大的难度。但是它所蕴藏的价值是巨大的,在最后,我简单介绍了我们所获得的结果与应用,并展示了我们目前的知识图谱页面。通过这一小节的学习,不知道你是否又获得了一些启发呢?原创 2022-10-09 21:35:24 · 1293 阅读 · 1 评论 -
数据挖掘思维和实战20 Apriori 与 FP-Growth:不得不再说一遍啤酒与尿布的故事
这节课里,我们介绍了两种关联关系挖掘的方法,其中 Apriori 使用了穷举的方式,而 FP-Growth 使用了树形结构来提高速度。关联关系挖掘通常使用的算法都非常简单,或者我们可以把关联关系挖掘转化成分类问题、聚类问题来解决都是可以的。在这节课中,我们还介绍了关联关系的评估指标,不管是用什么算法来挖掘的关联关系,都可以使用这些指标来进行评估。下一课时,我们会进入关联关系挖掘的实践课程,看看如何使用关联关系挖掘来解决业务中的问题。原创 2022-10-09 21:34:26 · 622 阅读 · 0 评论 -
数据挖掘思维和实战19 实践 3:使用线性回归预测房价
这节课中,我们使用了线性回归算法去实际处理了一个房价预测的问题,从数据的获取,数据的展示,再到模型训练和效果评估,算是一个比较完整的处理过程了。同时这节课里面也涉及了比较多的辅助代码,希望能够对你平时的工作或者学习有所帮助。好了,这一节实践课就到此结束了,同时关于回归问题的讲解也告一段落。不知道你是否对这部分的内容有了一定的掌握。其实回归算法的理念很容易理解,只不过要找到适合你的数据的回归算法需要一些经验。原创 2022-10-08 10:26:47 · 1756 阅读 · 0 评论 -
数据挖掘思维和实战18 线性回归与逻辑回归找到一个函数去拟合数据
完成了动手环节,让我们再来回顾一下本课时的重点内容。在这节课中,我们介绍了回归方法,其中主要讲解了线性回归,同时简单介绍了逻辑回归。它俩虽然都有“回归”这个字眼,却存在着一些区别,当然,也有着一些相似。然后我们借助工具包实现了线性回归的代码调用,并绘制了相应的图像来展示回归的效果。回归方法是非常常用的数据分析和数据挖掘方法,它的原理简单、运行快速,在很多数值型的预测需求中都发挥着巨大的价值。当然,除了这一小节中讲的线性回归和逻辑回归,还有很多不同的回归方程可以使用,以解决不同的问题。原创 2022-10-08 08:27:39 · 352 阅读 · 0 评论 -
数据挖掘思维和实战17 实践 2:如何使用 word2vec 和 k-mean 聚类寻找相似的城市
在这一节实践课程中,我着重介绍了整个模型训练环节的代码,其中主要写了两段代码,分别训练了 Word2Vec 模型和 K-means 模型。除了数据部分,这些代码几乎可以复制即运行。到这一课时,关于聚类问题的内容就告一段落了,在数据缺少标注的时候,聚类算法是十分常用的,它可以帮助我们了解数据情况。当然,聚类方法也存在一些局限,还需要在日常的工作中多加练习,不断积累自己的经验。原创 2022-10-08 08:24:54 · 603 阅读 · 1 评论 -
数据挖掘思维和实战16 DBScan 聚类:打破形状的限制,使用密度聚类
完成了动手环节,这节课的主要内容就介绍完了。这节课我们学习了聚类算法的第二个方法“DBSCAN”算法。它是基于密度的聚类方法,与前面讲的 K-means 不同的是,它可以很好地解决数据形状不规则的情况。在算法原理环节,有几个概念需要你仔细去理解,只要明白了那几个概念,DBSCAN 算法的核心也就可以掌握了。原创 2022-10-08 08:22:56 · 633 阅读 · 0 评论 -
数据挖掘思维和实战15 k-mean 聚类:擒贼先擒王,找到中心点,它附近的都是一类
写到这里,本课时的主要内容已经告一段落。这节课我们进入了新的算法类型——聚类算法的学习。在开头我又简单介绍了一下什么是聚类算法,聚类与分类有什么样的区别,接着就讲到了本节课的主角——K-means 算法,它是一种非常简洁的基于划分的聚类算法。与前面一样,在介绍完算法的思想之后我加入了一段代码来实现快速上手,并且加入了一个画图的方法来展示聚类的效果。在看完了这一课时的内容之后,你是否能在自己的工作中使用 K-means 来解决问题了呢?下一课时,我们将介绍另外一种聚类算法“DBScan”,到时见。原创 2022-10-08 08:03:48 · 565 阅读 · 0 评论 -
数据挖掘思维和实战14 实践 1:使用 XGB 实现酒店信息消歧
关于酒店信息消歧的实践,本课时就介绍到这里,这节课我重点讲解了在做数据挖掘的时候,对业务的深入理解过程,用一个实例来演示如何随着我们理解的深入,进而一步步处理我们的数据以及解决问题的。受到篇幅的限制,这节课程中我并没有放入全部的代码,这部分的详细代码后面会放在代码库,有兴趣的同学可以在代码库中查看。在我们的工作中,算法部分往往成了最简单的环节,如何去处理需求、如何去构建特征、如何调整我们的思路才是我想要传达给你的。经过这一次实践,我希望你能够对数据挖掘在实际工作中是如何进行的能够有一定的理解。原创 2022-10-08 08:02:22 · 715 阅读 · 0 评论 -
数据挖掘思维和实战13 人工神经网络:当前最火热的深度学习基础
这节课又到了跟大家说再见的时候,在本小节的内容中,我们先认识了人的神经元,并了解了神经元的工作过程,从而引入到人工神经网络的构建上来。在介绍了人工神经网络的原理和优缺点之后,我在代码中展示了不同规模的神经网络对预测效果产生的影响。原创 2022-10-08 08:01:19 · 333 阅读 · 0 评论 -
数据挖掘思维和实战12 支持向量机(SVM):用一条线分开红豆与绿豆
我们首先想一想什么是平面。根据定义,在三维空间中,平面就是到两个点距离相同的点的轨迹。一个平面没有厚度,而且可以把空间分割成两部分。而超平面就是在这个基础上进行的延伸,在维度大于三维的时候仍然满足上面的条件,而且它的自由度比空间维度小 1。对于这样的一个数学概念,就称为超平面。通俗地讲,在二维中就是直线,在三维中是平面,在三维以上的维度中就是超平面。假设我们已经找到了一条线(不一定是最优的那条)可以分割红豆和绿豆,红豆和绿豆中距离这条线最近的几个样本点就被称为支持向量(Support Vector)原创 2022-10-08 07:44:00 · 458 阅读 · 0 评论 -
数据挖掘思维和实战11 朴素贝叶斯:算一算你是否要买延误险
讲到这里,我们这一课时的内容又要结束了,不知道你是否意犹未尽?我在这节课里讲解的朴素贝叶斯算法是一个非常简洁的算法,只需要进行比较简单的数学计算就可以获得我们所要的结果。在开头,我列举了一个关于计算是否要买延误险的例子,那么通过这一节的学习,你下次买机票的时候是不是也可以算一算自己是不是要买延误险了?这节课的动手实践部分比较简单,希望能够加深你的动手能力。原创 2022-10-08 07:41:23 · 360 阅读 · 1 评论 -
数据挖掘思维和实战10 决策树:女神使用的约会决策
这一小节的课程,我们讲解了第二个分类算法——决策树算法,首先从女神如何决策跟谁约会的问题出发,引出了决策树算法的原理,由于决策树算法非常容易理解,效果很好而且易于解释,所以研究者提出了各种各样的改进方案,并由决策树延伸出了很多新的优秀的算法。在尝试动手的环节,本课时加入了一些绘图的技巧,希望大家也能够掌握这部分的内容,这样也可以提升工作效率。看完了决策树算法的介绍,不知道你是否对其中的细节还有什么疑惑?你可以在评论中写下来与大家一起讨论。附:补充材料 | 关于 GraphViz 的异常处理。原创 2022-10-07 09:27:33 · 445 阅读 · 0 评论 -
数据挖掘思维和实战09 KNN 算法:近朱者赤,近墨者黑
这一小节,我们开始真正走进了一个算法之中,去研究算法的奥秘。当然,我期望以一种简单易学的方式向你介绍算法的原理,并去掉了那些让人头疼的计算公式。在这一节里,我介绍了KNN分类算法,从一个例子开始,然后引入了它的原理,并希望你能了解它的优缺点,对于后面的算法,我也会沿用这种方式去介绍。最后,我还写出了一段简单的代码,如果你已经在电脑上安装了 Python,那你可以复制并直接运行它,当然我希望你能够自己去敲一遍代码,这样也能够加深你的印象。原创 2022-10-07 09:26:18 · 297 阅读 · 0 评论 -
数据挖掘思维和实战08 模型应用:我们的模型是否可以解决业务需求?
在项目部署上线之后,我们的项目算是告一小小的段落了,但是不要忘了对我们的工作进行总结,整理一下文档。总结的内容包括:从项目的需求发起,到数据准备,再到模型训练、评估、上线,这些环节都遇到了什么样的问题,我们解决了什么问题,又有哪些问题尚未解决,如果在时间等条件充裕的情况下还可以做哪些尝试。同时认真地做一下反思,把整个项目中的重点知识内化成自己的能力。良好的项目总结文档会带给我们很多便利,方便我们在项目迭代时查阅,同时也是对自己工作的总结,在做过很多项目之后,这些积累将成为你宝贵的经验与财富。原创 2022-10-07 09:25:08 · 431 阅读 · 0 评论 -
数据挖掘思维和实战07 模型评估:如何确认我们的模型已经达标?
这一课时我们终于进入了模型评估环节,这是检验模型效果的重要阶段,直接决定一个模型是进入下一个环节,还是回到上一个环节回炉重炼。我们主要讲了模型的各种评估指标,从一个混淆矩阵出发,衍生出一系列的准确度评测;然后对模型泛化能力进行评估。在评估指标后面,我们又介绍了如何在数据上进行一些优化从而减少评估时产生误差,这部分是准备数据的延伸。在这里需要说明的是,这一课时我们所介绍的模型评估方法中,主要适用于分类模型,因为分类模型是一种有监督模型,所以通过指标来进行评测相对容易。原创 2022-10-07 09:22:41 · 994 阅读 · 0 评论 -
数据挖掘思维和实战06 数据建模:该如何选择一个适合我需求的算法?
在这一课时,我介绍了工作中最常见的四大问题以及模型集成,我想你应该学到了这些问题的内部机理,并且知道要解决这些问题需要有什么样的思路。但是在这一课时中,我并没有介绍算法的细节,别担心,我会在后面的课时中详细展开。你可以思考一下,在平时的工作生活中,除了这四种问题是不是还有别的问题可以用到数据挖掘来解决呢?你遇到的问题是否可以通过相互转化变成这 4 种问题中的一种来进行处理呢?欢迎将你的思考和疑问写在留言区,与我和其他同学分享交流。原创 2022-10-07 09:21:48 · 537 阅读 · 0 评论 -
数据挖掘思维和实战05 准备数据:如何处理出完整、干净的数据?
写到这里呢,关于数据准备的工作已经进行得七七八八了,不知道你看完之后是否对准备数据有了一个比较全面的认识呢?在该环节,我们将走下象牙塔,走进实际的工作当中,处理在现实中数据存在的各种问题以使得数据达到我们模型算法的要求。通过这些步骤,可以说数据准备已经比较充分了,数据挖掘中最困难、最烦琐的一个步骤已经结束,接下来我们就要进入到模型训练的环节了。在这里呢,我想给大家布置一个问题,你可以观察一下你所能够获得的数据,仔细查看里面会有什么样的问题呢?欢迎你在留言区写下你的问题,与我和其他同学一起讨论。原创 2022-10-07 09:20:34 · 540 阅读 · 0 评论 -
数据挖掘思维和实战04 理解业务和数据:我们需要做好什么计划?
这一课时讲解了数据挖掘步骤的第一步,如果用一个词来总结的话,那就是“做好准备”。思想准备,确保自己已经具备了一个专业的数据挖掘工程师的思维模式;理解业务,确保与业务需求方的充分沟通,对业务需求的充分理解,知道什么可以做,什么不可以做;理解数据,确保对可以掌握的数据有全面的了解,知道哪些数据有用,哪些数据没用。我觉得作为一个工程师,通常在沟通方面可能会有所欠缺,比如我自己就是这样。所以如果你想要在沟通方面有所提升,我可以推荐两本书给你《非暴力沟通》《高难度沟通》,有时间可以读一下哦。原创 2022-10-07 09:19:43 · 654 阅读 · 0 评论 -
数据挖掘思维和实战03 工欲善其事必先利其器,扩展包与 Python 环境
Anaconda 是包管理器,也是环境管理器,更是 Python 的编辑器。其致力于为用户提供最便捷的方式来使用 Python,进行数据科学计算和机器学习。这个免费的软件安装起来非常方便,涵盖的源码包、工具包之多,以及适用的平台之广,使得该软件在安装、运行和升级等复杂的科学数据运算和机器学习环境方面变得极其简单。当前流行的三个开源软件库 sklearn、TensorFlow 和 sciPy 都支持 Anaconda,不仅如此,你还可以在网上找到该软件的免费交流论坛,随时进行讨论学习。原创 2022-10-07 09:18:36 · 369 阅读 · 0 评论 -
数据挖掘思维和实战02 Python 的数据结构和基本语法
Python 是一门面向对象、直译式编程语言, 编写简单、上手迅速,开源扩展包十分丰富,所以在数据挖掘的前沿科研和工业领域都广受欢迎,有着瑞士军刀般的价值。利用 Python,可以非常方便地开展各种领域的数据挖掘工作。在后续的课时中,如果没有特殊说明,一般使用的是 Python 3 的语法。因为 Python 3 相比 2 有了很大的调整和改进,对中文的支持也更加友好。下面我们先来看一下为什么要用 Python 进行数据挖掘。原创 2022-10-07 09:08:58 · 578 阅读 · 0 评论 -
数据挖掘思维和实战01 掌握数据挖掘,搭上划时代的数字化列车
这个问题看似很简单,但似乎也很难有一个明确的答案。如果非要给数据挖掘一个定义的话,那么我认为数据挖掘就是寻找数据中隐含的知识并用于产生商业价值。也就是说,它是我们在数据中(尤其是在大量的数据中)找到一些有价值,甚至是非常有价值的东西的一种手段。今天,我们主要来认识一下“数据挖掘”,让它不再是一个抽象的名词,从“它解决什么问题”和“怎么做”的角度建立了全面而具体的认识。后面的篇幅,我也将围绕这些内容进行展开和扩充讲解。原创 2022-10-07 08:59:00 · 478 阅读 · 0 评论 -
数据分析可视化15 PyEcharts & Flask 集成案例
通过图表响应事件,我们实现了页面图表元素和 PyEcharts 图表对象之间的绑定,并且为图表对象的参数获取设置了远程访问接口。原创 2022-10-06 08:49:53 · 3480 阅读 · 0 评论 -
数据分析可视化14 PyEcharts & Flask 框架集成
上一节,我介绍了“”的第一课,Python Flask Web 框架基础理论,带你了解了 Flask 框架的主要特性、源码资源、安装部署和基本使用方法。接下来,我会介绍该部分的第二节,,包括 PyEcharts 与 Flask 框架整合的两种方法和数据刷新机制。完整的知识结构如下图所示:图 1:章节知识结构图PyEcharts 与 Flask 整合的方式有两种:前后端混合模式和前后端分离模式。是指前端页面设计和后台服务响应设计糅合在一起,页面内容的渲染由后台程序控制;原创 2022-10-06 08:47:38 · 2530 阅读 · 0 评论 -
数据分析可视化13 Flask Web 框架基础
Flask 是一个用 Python 语言开发的、轻量级的、可扩展的 Web 应用程序框架,它基于 Werkzeug WSGI 工具包和 Jinja2 模板引擎进行封装和拓展。Werkzeug WSGI 提供了路由处理、请求和响应封装,Jinja2 则提供模板文件处理。Flask 是 Python 语言三大主流开发框架之一,另外两个分别为 Django 和 Pyramid。了解了 Flask 的常用插件,我们接下来通过一个案例的方式,学习一下 Flask 的使用方法。导入模块、声明对象、路由设置、原创 2022-10-06 08:46:12 · 1742 阅读 · 0 评论 -
数据分析可视化12 案例 6:竞争优势多维分析图设计
上一小节,我介绍了案例 5:门店盈利能力对比图的设计和使用,掌握了如何基于对比维度,进行多个项目的对比分析。本节内容,我介绍案例 6:竞争优势多维分析图的设计和使用,本节内容在整个案例部分的位置如下所示:图 1:章节内容定位上图中,橙色部分是我本节要讲的内容:竞争优势多维分析。门店盈利能力对比分析,是从对比维度,描述不同门店之间,经营状况的差异。对比的维度是从单一维度进行分析,但是很多情况下,评判一个事务的状况,我们需要从多个不同的维度进行分析。原创 2022-10-06 08:44:39 · 933 阅读 · 0 评论 -
数据分析可视化11 案例 5:门店盈利能力对比图设计
上一小节,我介绍了客户地理位置分布图和 PyEcharts 地图的设计和使用方法。本小节,我会介绍另外一种图表:门店盈利能力对比图。本节内容在整个案例部分的位置如下图所示:图 1:章节内容定位上图中,橙色部分是我会在本节介绍的内容:门店盈利能力对比分析。客户地理位置分布是从空间分布维度,描述客户的空间分布情况,门店盈利能力则是从对比维度,描述不同门店之间经营状况的差异。数据可视化分析案例部分,我会采用前面的操作流程,分步骤实施,逐项介绍常用的可视化图表的设计和使用方法。原创 2022-10-06 08:42:13 · 1433 阅读 · 0 评论 -
数据分析可视化10 案例 4:客户地理位置分布图设计
在上一个小节,我介绍了案例 3:PyEcharts 订单商品构成模型图的设计和使用。接下来,我们将进入本课程模块三的 10 课时案例 4:客户地理位置分布图设计和使用。本小节是我们 6 个案例中的第 4 个案例,该案例在整个构成模型中的位置如下:图 1:章节内容定位上图中,红色部分是我将要在本节介绍的内容:客户地理位置分布图设计和使用。数据指标卡可以用来监控业务指标的波动范围是否符合预期,历史数据变化趋势用于预测未来,订单商品构成模型用于发现核心元素,原创 2022-10-06 08:40:33 · 1721 阅读 · 0 评论 -
数据分析可视化09 案例 3:订单商品构成模型图设计
上一小节,我介绍了案例 2:PyEcharts 历史数据变化趋势图的设计和使用。接下来,让我们进入数据分析与可视化精讲的案例 3:订单商品构成模型图设计和使用。本小节是我们 6 个案例中的第三个案例,该案例在整个数据可视化分析构成模型中的位置如下所示:图 1:章节内容定位上图中,橙色部分是本节我要介绍的内容:订单商品构成模型图。实时监控数据指标卡用于呈现业务和发现业务问题,通常呈现的是业务的整体特征,一旦发生问题和异常,则需要引入多个不同的维度,对问题进行分析和判断。原创 2022-10-06 08:37:31 · 750 阅读 · 0 评论 -
数据分析可视化08 案例 2:历史数据变化趋势图设计
历史数据变化趋势图,可以用来呈现任何需要的、具有时间序列特征的指标。具体的指标可以基于业务需求选择。影片租赁业务共涉及 3 个主要的业务活动,具体需要考虑的指标为:订单量、交易额、库存量。本案例中,我们选择订单量作为我们分析的指标。指标名称业务逻辑计算逻辑订单量当日出租影片的数量和SELECT * FROM dm_rental_day ORDER BY 日期 ASC交易额当日出租影片的收入和库存量当日库存影片的数量和表 1:指标定义呈现指标随时间变化的趋势。原创 2022-10-06 08:34:26 · 1862 阅读 · 0 评论 -
数据分析可视化07 案例 1:实时数据监控指标卡设计
实时数据监控需要监控的是核心业务指标。对于影片租赁业务而言,需要监控的核心指标就是交易数据:每天的实时的收入、交易量和库存数,共 3 个主要的业务活动。具体需要考虑的指标为:订单量、交易额和库存量。本案例中,我选择了订单量作为我们分析的指标。关于以上三个指标定义如下表所示:表 1:指标定义交易额和库存量的计算逻辑可以参考订单量生成。实时数据监控指标卡通常用于呈现业务和发现问题,因此除了核心指标的实时数值之外,通常需要结合指标的同比、环比、时间进度和任务目标完成状态等因素。原创 2022-10-06 08:32:09 · 2212 阅读 · 0 评论 -
数据分析可视化06 PyEcharts 开发快速入门
我在“04 | 图表组件:Echarts数据可视化图表基础”这一课时中简单介绍了 PyEcharts 的参数配置项和图表元素之间的映射关系:PyEcharts 图表配置项这里,我将详细介绍具体的配置项的参数设置方法。PyEcharts 配置项分全局配置项和系列配置项,其中全局配置项作用域为整个图表(与具体需要呈现的数据内容无关),可以理解为静态部分;系列配置项作用范围为基于数据动态绘制的部分。序号类名称主要功能1初始化配置项尺寸、主题样式2工具箱配置项是否显示、位置、工具项3。原创 2022-10-06 08:34:53 · 1156 阅读 · 0 评论 -
数据分析可视化05 框架搭建:PyEcharts 数据可视化环境
Python 是一门富有表现力的开发语言,是数据科学和人工智能在学习和科研场景下的首选语言。Python 语言的主要特点包括以下几个方面。简单、易学:Python 语言的语法规则、数据类型相对简单易学,可以快速入门。开源、免费:Python 语言是一个基于 C/C++的开源的项目,可以免费使用。跨平台支持:Python 语言支持主流的操作系统:Windows、Linux、Mac、IOS、安卓等,Python 程序可以在各个平台之间实现无缝迁移。资源丰富。原创 2022-10-05 09:50:34 · 1494 阅读 · 0 评论 -
数据分析可视化04 图表组件:Echarts数据可视化图表基础
Echarts 是一个开源的、免费的、成熟的、商业级图表可视化框架,是 Apache 开源社区的顶级项目之一,也是国内使用最多和最为广泛的可视化图表框架之一。数据可视化图表框架并没有一个统一的行业标准,比较常见的有 D3、Highcharts 等,Echarts 因其图表丰富、主题多样美观大方、开源免费、文档资料健全,逐渐成为国内用户的首选,是事实上的行业标准。原创 2022-10-05 09:47:46 · 2009 阅读 · 1 评论 -
数据分析可视化03 技术框架:数据可视化分析的两种武器
上一节,我介绍了数据可视化分析方法,带你了解了数据可视化分析的建设目标、工作方法和工作流程。和。数据可视化技术完整的知识结构如下图所示:本节知识结构图本节课,我将介绍主流的数据可视化分析工具、数据可视化开源框架分别有哪些,让大家对数据可视化技术资源有一个全局的认知。、、和。原创 2022-10-05 09:45:16 · 1752 阅读 · 0 评论 -
数据分析从零到精通第七课 快速面试与入职
22 提高效率:数据分析师知识构成及管理这一节为你分享一些数据分析师良好的工作习惯,希望能帮助你在工作中提高工作效率。请跟我认真学习下面 6 个数据分析师应该养成的工作习惯。1. 整理通用和常用代码,实现半自动化。SQL 是数据分析师的必备技能之一,也是我们工作中最常用的工具之一。SQL 有一个很大的特点就是语法格式相对固定,这就意味着 SQL 脚本在很大程度上是可以复用的。工作中,我们可以通过整理 SQL 代码,减少重复敲代码的时间来提高效率。整体通用 SQL 代码比如常用的函数,ro翻译 2022-05-28 10:47:59 · 1250 阅读 · 0 评论 -
数据分析从零到精通第六课 流量转换、效率宣传牌和量化模型
19 商业变现:流量的商业闭环分析你好,我是取经儿。今天给大家分享流量的商业变现,希望通过这篇课程让大家提升对流量的认知。我们分三部分来认识流量的商业价值。什么是流量?流量的变现方式有哪些?数据在流量变现扮演什么角色?下面经哥带你认知全新的流量世界。什么是流量?我们从小明同学日常生活中的衣食住行、娱乐、社交等场景来认识流量的世界。小明的一天:上午 9 点,小明乘坐地铁来公司上班,地铁站小明看到各家公司广告牌,有双十一购物节、新上线电影宣传、医疗美容、工作求职等。10翻译 2022-05-28 10:42:10 · 609 阅读 · 0 评论 -
数据分析从零到精通第五课 数据流量、策略、入口资源和AB实验设计
14 经典案例:如何搭建信息流产品数据分析指标体系你好,我是取经儿。今天给你分享的是信息流产品的数据指标体系。我们分三步来讲解信息流的数据指标体系。第一步,介绍什么是信息流产品。第二步,用户使用信息流产品的场景。第三步,信息流产品的数据指标体系。信息流产品的介绍信息流产品是解决信息分发的平台。它将接入的信息经过数据挖掘打上丰富的标签,将其推送到感兴趣的人眼前。当内容足够丰富时,信息流产品可以为用户推荐无限多感兴趣的内容,平台也以此为基础,通过在信息流里插入广告来赚取收入。如上图所示,信息流翻译 2022-05-28 10:32:53 · 1508 阅读 · 0 评论