商业智能
文章平均质量分 55
NO23412号菜狗
这个作者很懒,什么都没留下…
展开
-
卷积神经网络(CNN)详解
卷积神经网络(CNN)详解 - 知乎 (zhihu.com)原创 2021-08-09 10:38:55 · 319 阅读 · 0 评论 -
重点函数 | ISCROSSFILTERED用法介绍
重点函数 | ISCROSSFILTERED用法介绍 - 知乎 (zhihu.com)原创 2021-07-02 11:18:53 · 220 阅读 · 0 评论 -
POWERBI 掌握时间智能函数,同比环比各种比,轻松搞定!
掌握时间智能函数,同比环比各种比,轻松搞定! - 知乎 (zhihu.com)原创 2021-06-30 10:09:54 · 1892 阅读 · 0 评论 -
超全汇总!机器学习常用术语词汇表——下篇(建议收藏)
NNaN 陷阱 (NaN trap)模型中的一个数字在训练期间变成NaN,这会导致模型中的很多或所有其他数字最终也会变成 NaN。NaN 是“非数字”的缩写。负类别 (negative class)在二元分类中,一种类别称为正类别,另一种类别称为负类别。正类别是我们要寻找的类别,负类别则是另一种可能性。例如,在医学检查中,负类别可以是“非肿瘤”。在电子邮件分类器中,负类别可以是“非垃圾邮件”。另请参阅正类别。神经网络 (neural network)一种模型,灵感来...原创 2021-05-28 12:42:12 · 1170 阅读 · 0 评论 -
语音处理的分帧,帧移,加窗,滤波,降噪,合成概念理解
一、分帧语音数据和视频数据不同,本没有帧的概念,但是为了传输与存储,我们采集的音频数据都是一段一段的。为了程序能够进行批量处理,会根据指定的长度(时间段或者采样数)进行分段,结构化为我们编程的数据结构,这就是分帧。二、帧移由于我们常用的信号处理方法都要求信号是连续的,也就说必须是信号开始到结束,中间不能有断开。然而我们进行采样或者分帧后数据都断开了,所以要在帧与帧之间保留重叠部分数据,以满足连续的要求,这部分重叠数据就是帧移。三、加窗介绍帧移的时候我们说了,我们处理信号的方法都要求信号是原创 2021-05-19 08:58:46 · 1596 阅读 · 0 评论 -
FloC背后联邦计算
近几天谷歌因为一项叫做FLoC的技术而被骂上了热搜,笔者看了一下这是一种基于联邦学习的“用户追踪”技术,可以在不暴露客户隐私的情况下进行用户画像及大数据营销,这项技术对于谷歌这种广告收入占总体营收9成的互联网公司来讲意义重大。其实FLoC相比于Cookie从某种程度上讲还是有一定进步的,通过Cookie网站能轻松追踪到用户的所有上网行为,而通过FLoC只能追踪到分类相同的用户组,从这个逻辑上讲今后如果读者突然发现APP突然疯狂向你推荐某些莫名其妙的商品,那很有可能是你所在的用户组中的其它人搜索这种.原创 2021-05-11 14:07:34 · 504 阅读 · 0 评论 -
机器学习分类算法(附图文详解)
说起分类算法,相信学过机器学习的同学都能侃上一二。可是,你能够如数家珍地说出所有常用的分类算法,以及他们的特征、优缺点吗?比如说,你可以快速地回答下面的问题么:KNN算法的优缺点是什么? Naive Bayes算法的基本假设是什么? entropy loss是如何定义的? 最后,分类算法调参常用的图像又有哪些?答不上来?别怕!一起来通过这篇文章回顾一下机器学习分类算法吧(本文适合已有机器学习分类算法基础的同学)。机器学习是一种能从数据中学习的计算机编程科学以及艺术,就像下面这句话说得原创 2021-04-22 08:12:20 · 3289 阅读 · 0 评论 -
帕累托图 概念
帕累托图是品管七大手法之一,是一种查找问题原因的分析方法,在质量管理中,我们常用帕累托图(排列图)来分析质量问题产生的主要因素,从而有重点的采取纠正措施。什么是帕累托图?帕累托图是一种按发生频率大小顺序绘制的特殊直方图,故又名排列图、主次图。帕累托图以意大利经济学家帕累托(Vilfredo Pareto)的名字命名。帕累托图与帕累托法则一脉相承,帕累托法则又称二八法则或80/20法则,即百分之八十的问题是百分之二十的原因所造成的。对于质量问题而言,就是说数量较少的原因往往造成绝大..原创 2021-03-25 16:59:21 · 6565 阅读 · 1 评论 -
hive sql 常用技巧
1.多行合并多行合并常用于做区间统计,通过定义一定的金额区级,将上亿的记录降维为不同区间内总数。概括来说就是多映射到一。典型场景:基于用户交易天流水,计算每天不同金额段的金额笔数。如用户的天交易流水表结构如上,需要计算出交易额在0-100,100-200,200-300,大于300几个区级的笔数,CREATE VIEW t_deal_tmp_view_1 ASSELECT CASE WHEN rcv_amount <= 100 THEN 1原创 2021-03-21 15:45:52 · 1713 阅读 · 0 评论 -
0-1搭建用户画像系统的设计思路
一、需求目的①、商城已上线2周年,已有10万+在售物品。数据仓库中积累着大量的业务数据、日志数据及埋点数据。如何充分挖掘沉淀在数据仓库中的数据的价值,有效的支持用户画像的建设,成为当前的重要工作。②、在保证用户规模不断增长的目标下,运营方考虑建立用户流失预警机制,及时识别将要流失的用户群体,及时采取运营策略换回用户。二、产品结构三、用户画像系统搭建流程目前团队已经搭建了比较成熟的数据仓库。也就是说已经有结构化的、清晰的用户属性、用户行为相关数据。在此基础上,搭建用户画像系统,需要:原创 2020-12-28 17:53:52 · 413 阅读 · 0 评论 -
tableau完整案例:使用集值做互动分析
一、数据一览与客户需求在真实的业务场景中,分析始于问题、始于需求,而非开始于数据。所以千万不要拿到数据着急寻找珍珠,否则往往是越看越纠结。我拿到的数据是仅一分钟内的传感器数据,对方临时生成的数据,明显数据结构并非完美,原表中同时包含了原始数据和二次加工的分析数据。对方想要查看的视图,一是左上角分析字段在60秒的波动情况,二是在每秒1000次(专业术语大概是1000Hz)的数值波动,查看波峰波谷,这里分为原始数据和傅里叶数据两种,每秒可以视为一个系列。客户之前使用Excel做了一个模拟,同时展示三原创 2020-12-07 08:27:05 · 984 阅读 · 0 评论 -
【Tableau图表】二维条形码图(Barcode plot)
将销售额字段拖放至列功能区,并调整为维度 将地区字段拖放至行功能区 调整一下颜色标记卡的透明度 为了集中趋势效果好,我将坐标轴,改成了对数轴二维条形码的效果就出来了。为了展示与分析效果,给单元格添加一个平均线。总结一下,其实就是对度量数据不要进行汇总,把所有数据按照坐标位置进行排放。 虽然没有调整默认的图表类型设定,但要注意,图表类型是甘特图。...原创 2020-12-04 04:20:46 · 720 阅读 · 0 评论 -
pandas 拆分 列 的一个特别例子
class_name列同时包含课程名称和同类群组编号。我想将栏分为两栏(名称,同类群组编号)从:| class_name || introduction to programming 1th || introduction to programming 2th || introduction to programming 3th || introduction to programming 4th || algorithms and data structure 1th || a.原创 2020-11-20 15:03:12 · 261 阅读 · 0 评论 -
时间数据处理之Arrow库
在处理数据的时候经常会碰见各种时间数据,但因为时间数据的格式不统一,所以导致数据处理的时候有一些麻烦。Python的标准库提供了相应模块,但可用性却不高,也不够人性化。本专栏之前已经有文章介绍过在R中如何处理时间数据(lubridate包),而Python中也有实现类似功能的包。这篇文章我们讲一下如何使用Python的第三方库Arrow来处理时间数据。Arrow提供一种易用的智能的方式来创建、操作、格式化和转换时间数据。基本使用Arrow处理时间数据时需要先将数据转为Arrow对象,Arrow可原创 2020-11-20 11:04:54 · 381 阅读 · 0 评论 -
tabelu 条形图及技巧
Use bar charts to compare data across categories. You create a bar chart by placing a dimension on theRowsshelf and a measure on theColumnsshelf, or vice versa.A bar chart uses theBarmark type. Tableau selects this mark type when the data view matc...原创 2020-11-11 19:48:37 · 321 阅读 · 0 评论 -
Tableau 上下文过滤器
Tableau中的正常过滤器彼此独立。这意味着每个过滤器从源数据读取所有行,并创建自己的结果。但是在某些情况下,我们希望第二个过滤器只处理第一个过滤器返回的记录。因此,在这种情况下,第二个过滤器称为依赖过滤器,因为它们只处理通过上下文过滤器的数据。上下文过滤器有两个主要目的。提高性能- 如果设置了大量过滤器或具有大型数据源,查询可能会很慢。您可以设置一个或多个上下文过滤器以提高性能。 创建从属数字或前N个过滤器- 您可以设置上下文过滤器以仅包括感兴趣的数据,然后设置数字或前N个过滤器。创建上下文..原创 2020-11-07 02:58:29 · 918 阅读 · 0 评论 -
win10 安装配置 redis
Github下载地址:https://github.com/MicrosoftArchive/redis/releases二、安装Redis1.首先双击现在完的安装程序2.点击next3.点击接受 继续next4.设置Redis的服务端口 默认为6379 默认就好,单击next5.选择安装的路径,并且打上勾(这个非常重要),添加到path是把Redis设置成windows下的服务,不然你每次都要在该目录下启动命令redis-s...原创 2020-11-02 08:51:44 · 299 阅读 · 0 评论 -
Tableau基本操作 | 拆分、合并字段,创建文件夹、分层结构、计算字段、组、集、参数、数据桶
拆分、合并字段拆分字段变换-自定义拆分(选择拆分可以直接默认进行拆分)-设置自定义拆分方式合并字段通过创建计算字段实现使用加号 (+) 运算符合并两个字符串字段[类别]+'-'+[子类别]创建文件夹、分层结构创建文件夹通过创建文件夹可以对同类别或有关联的字段进行分类,方便后续操作查找。在维度和度量处均可通过:1、空白处右键-创建文件夹将字段拖拽至文件夹,或选中某几个字段-文件夹-添加至文件夹-选择相应文件夹2、选中要分类的字段-右键-文件夹-创建文件夹创建分层结构原创 2020-11-01 10:06:06 · 2903 阅读 · 0 评论