• 博客(14)
  • 收藏
  • 关注

原创 为什么我基于开源包建的模型效果不好?

机器学习发展到今天已经有众多优秀前辈给我们贡献了各种各种现成的开源包以最流行的 Scikit-learn 为例,提供了包括回归 (Regression)、降维(Dimensionality Reduction)、分类(Classfication)、聚类(Clustering) 等方法的开源包,使用者可以灵活的实现各种建模操作。但是也有人发现了,同样的开源包不同的人建出的模型效果是不一样的,甚至大相径庭。为什么大牛就能建出高质量模型,而我基于开源包建的模型效果总是不尽人意呢?主要原因有以下三点:首先是

2020-07-28 12:17:37 226

原创 程序数据集上的多维分析

【摘要】当数据源不是来自文件和 SQL,而是由程序现计算出来的,这种情况在许多 BI 系统中都会出现,BI 系统自己管理数据模型,把数据库挡在后面,不会直接开放 SQL,更不会提供文件让你直接访问,访问数据都要通过程序接口(比如 JavaAPI 或 Webservice)——这样一来,想要对这些程序接口返回的结果集做多维分析看似就有些困难了。没关系!润乾多维分析分分钟就能帮您搞定!程序数据集上的多维分析!小编我本着先客户之忧而忧的服务宗旨,思前想后还是觉得之前的《把 Excel 透视表搬到 WEB.

2020-07-21 16:52:49 140

原创 给一句 SQL 就能做多维分析

【摘要】多维分析程序支持对任何数据库做 SQL 数据集多维分析,只需先把数据源配置好,然后程序猿啪啪几下敲下需要进行多维分析的 SQL 语句就可以,灵活便捷,去乾学院看个究竟:给一句 SQL 就能做多维分析!《把 Excel 透视表搬到 WEB 上》我们以 Excel 文件数据集为例,介绍了如何把 Excel 的数据透视表嵌入到俺的应用程序中。爱学习的同学会问了,Excel 数据透视表可以使用 Excel 里取到的任何数据,比如数据库取数,你们能直接从数据库取数做分析吗?Yes,ICan!俺的程.

2020-07-21 16:43:46 189

原创 把 Excel 透视表搬到 WEB 上

【摘要】Excel 透视表 - 只要遇见就不曾忘记!根据原始数据勾勾选项拖拖拽拽,分析数据嗖一下就出来了,这么好用的东西怎么能移到 WEB 上呢?去乾学院看个究竟:把 Excel 透视表搬到 WEB 上!提起 Excel 一定都不陌生,尤其是里面的数据透视表,对于需要进行聚合分析的情况,根据原始数据勾勾选选就能完成,用起来是倍儿爽吧。那么,操作起来这么省心的功能要是能移到 WEB 上,嵌入俺的应用程序里,是不是就完美了?so easy! 雷锋同志马上来教你做这事儿。主角登场——润乾报.

2020-07-21 16:36:21 120

原创 如何才能导出和打印 Echarts 图形?

【摘要】Echarts,江湖人称一个纯 Javascript 的图表库,图形种类星罗棋布且个个颜值爆表,可以轻松驾驭 PC 和移动设备,与绝大部分浏览器都可称兄道弟,而且已然众多拥趸,还有不少报表对它采取了嫁接技术。这么棒的图标库如何能在报表工具里导出和打印呢?Echarts 图形是由 Javascript 亲自在前端网页上绘制的,需要从浏览器中截取图形才能导出和打印,而报表工具的导出功能是在后台实现的。所以这就有一定难度了,快去乾学院看个究竟:如何才能导出和打印 Echarts 图形?!.

2020-07-20 16:08:54 633

原创 建模高手与初学者的差别在哪里?需要什么样的人来建模?

我们知道,数据挖掘的基本流程包括:(1)业务理解、(2)数据理解、(3)数据准备、(4)数据预处理和建模、(5)模型评估、(6)模型部署应用。其中第 4 步,数据预处理和建模是整个流程的核心部分,其他的步骤都是围绕的该步骤进行的。建模高手和初学者的差距也往往在这里,建出一个模型很容易,快速高效的建出一个好的模型却不容易。机器学习发展到今天已经有众多优秀前辈给我们贡献了各种各种现成的算法包,例如在 Scikit-learn 里就提供括回归 (Regression)、降维(Dimensionality Re

2020-07-20 14:51:29 245

原创 完成一个预测建模项目一般需要多长时间?

为了回答这个问题,我们先来了解一下建模的流程,通常一个完整的数据挖掘项目包含以下流程(1)业务理解、(2)数据理解、(3)数据准备、(4)数据预处理和建模、(5)模型评估、(6)模型部署应用。这个流程的操作性很强,也是业界公认标准。业务理解的主要工作有需求调研,了解商务背景;明确业务目标和成功的标准。数据理解和业务理解一般是同时进行的,主要内容包括确定建模所需要的数据,描述数据,探索数据,检验数据质量,明确数据挖掘目标和成功标准。这两个阶段的主要任务就是明确挖掘目标和建模数据,目标和数据都明确以后就

2020-07-14 10:45:26 1235

原创 有没有简单易用的数据挖掘工具?

当前用于数据挖掘的工具软件主要有两类,早期都是有图形化界面的商用软件,比如 SAS 和 SPSS,此类工具历史悠久,性能稳定。图形化的操作界面基本以拖拽填写为主,配合少量脚本编程,使用较为方便。不过,此类工具的价格也比较高,一般只有大型企业在用。近年来,随着人工智能的普及,出现许多开源编程类工具,以 Python 和 R 为代表,此类工具操作灵活,支持多种数据挖掘相关拓展库。而且,因为开源而完全免费。但是,无论是图形化操作工具还是开源编程类工具,都要求使用者具备丰富的统计学经验、机器学习算法知识,否

2020-07-13 11:11:09 225

原创 做人工智能为什么经常要学 python?

当前,提到人工智能、数据科学几乎就一定会提到 Python,很多人工智能相关的课程实质上也都在大篇幅的讲 Python,有的初学者甚至认为人工智能和 Python 是划等号的,随着人工智能概念的火热几乎掀起了一股全民学 Python 的热潮。那么,作为一种计算机程序语言,Python 到底有何魅力,如此受到人工智能的喜爱。总结下来,主要就是两点:(1)丰富的类库支持Python 从面世以来逐渐发展出了一个大型、活跃的科学计算及数据分析社区,成为数据科学、机器学习和学术 / 工业界通用软件开发等领域的

2020-07-13 11:08:01 228

原创 数据挖掘建模需要什么样的数据?多大量?

数据挖掘通常需要结构化数据才能建模,而不是近些年来热闹的非结构化数据,预测建模仍然是结构化数据上的运算!所谓结构化数据,是指表现为二维形式的数据,一般特点是:数据以行(也称样本)为单位,一行数据表示一个实体的信息,每一行数据的属性(也称字段或列)是相同的。结构化数据可以来自于数据库,也可以来自于文本文件或 Excel。例如预测 titanic 幸存者数据见下图,就是一个结构化数据,数据的每一行表示一个乘客样本,每一列的属性都是相同的例如”Age”列都表示乘客的年龄,这样的数据是可以拿来建模的。

2020-07-13 11:06:14 946

原创 数据挖掘是什么?能解决什么问题?

数据挖掘其实是个“古老”的技术,已经有几十年历史了,近年来红火的人工智能又让这个古老技术有了更多关注。那么,到底什么是数据挖掘呢?它又能做什么事呢?傍晚小街路面上沁出微雨后的湿润,和煦的细风吹来,抬头看看天边的晚霞,嗯,明天又是一个好天气。走到水果摊旁,挑了个根蒂蜷缩、敲起来声音浊响的青绿西瓜,心里期待着享受这个好瓜。由路面微湿、微风、晚霞得出明天是个好天气。根蒂蜷缩、敲声浊响、色泽青绿推断出这是个好瓜,显然,我们是根据以往的经验来对未来或未知的事物做出预测。人可以根据经验对未来进行预测,那

2020-07-13 11:03:49 698

原创 制约数据挖掘业务的环节

各行各业都对数据挖掘表现出极大兴趣,也纷纷展开了应用尝试,但成功案例并不多,这是为什么呢?1. 数据质量差玩数据就像挖金矿。如果含金量高,那么挖掘难度就小,出金率就高,如果含金量低,那么就会难度大效果差。数据质量问题通常表现在三个方面。(1)数据量不足要教一个牙牙学语的小朋友什么是苹果,只需要指着苹果说“苹果”(可能需要重复这个过程几次)就行了,然后孩子就能识别各种颜色和形状的苹果了,简直是天才!然而,机器还没达到这一步,大部分机器学习算法需要大量数据才能正常工作。即使是最简单的问题,很

2020-07-13 11:00:54 197

原创 润乾报表多维分析功能漫游

【摘要】你是否也在苦苦找寻一个处理大量数据特别迅速的报表工具?你是否还在为成千上万数据的复杂计算感到头晕?润乾报表的多维分析功能漫游为您提供有效的解决方案:润乾报表多维分析功能漫游!润乾报表多维分析功能漫游是不是还在为成千上万的数据处理不完而苦恼?是不是一想到要处理这些数据就头大?今天又要为整理这些枯燥的数据加班怎么办?——不要担心!不要担心!润乾来拯救你!DQL分组分析的神秘力量会协助你顺利完成数据的操作与分析,加班?不存在的!隔壁组的老王和老李都羡慕哭了...

2020-07-13 10:40:38 196

原创 润乾报表 dashboard 分析

在《润乾报表多维分析功能漫游》一文中我们已经见识了润乾报表分析控件的妙处:可视化的拖拽模式,灵活的计算方式,脱离敲打复杂多变的查询语句,只需要动动鼠标就可以获取所需要的数据。除了多维分析外,润乾报表还有dashboard分析界面那就是仪表盘,简称DBD,即大屏和分析控件的结合。 DBD可以通过图表、图形等视觉元素,将多个来源的数据中所蕴含的信息的趋势、异常和模式展现出来。接下来让我们看看当大屏与分析控件结合...

2020-07-13 09:29:51 294

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除