数据分析与建模
NO23412号菜狗
这个作者很懒,什么都没留下…
展开
-
Softmax多分类器与Softmax层
Softmax多分类器与Softmax层 - 逾之 (zhongyue.site)原创 2021-08-03 14:22:40 · 370 阅读 · 0 评论 -
深度学习_损失函数(MSE、MAE、SmoothL1_loss...)
(102条消息) 深度学习_损失函数(MSE、MAE、SmoothL1_loss...)_Xiaobai_rabbit0的博客-CSDN博客_mse损失函数原创 2021-08-02 14:13:05 · 951 阅读 · 0 评论 -
拍拍贷“魔镜杯“金融风控算法大赛 - Top3实战复现
拍拍贷"魔镜杯"金融风控算法大赛 - Top3实战复现 - 知乎 (zhihu.com)原创 2021-07-29 15:44:58 · 717 阅读 · 0 评论 -
t分布随机邻居嵌入
t分布随机邻居嵌入 (pantsiao.com)原创 2021-07-27 11:14:54 · 343 阅读 · 0 评论 -
机器学习中常常提到的正则化到底是什么意思?
机器学习中常常提到的正则化到底是什么意思? - 知乎 (zhihu.com)原创 2021-07-19 13:46:06 · 279 阅读 · 0 评论 -
使用Python进行超参数优化
(99条消息) gridsearchcv参数_使用Python进行超参数优化_weixin_39737764的博客-CSDN博客原创 2021-07-16 16:50:03 · 496 阅读 · 0 评论 -
机器学习-谈谈逻辑回归里面的woe化
机器学习-谈谈逻辑回归里面的woe化-20170911 - 知乎 (zhihu.com)原创 2021-07-15 23:58:59 · 1658 阅读 · 1 评论 -
信用标准评分卡模型开发及实现
信用标准评分卡模型开发及实现 - 知乎 (zhihu.com)原创 2021-07-14 17:59:31 · 141 阅读 · 0 评论 -
GridSearchCV参数的介绍
(100条消息) GridSearchCV参数的介绍_朴素.无恙的博客-CSDN博客原创 2021-07-07 15:10:42 · 304 阅读 · 0 评论 -
【算法】超详细的遗传算法(Genetic Algorithm)解析
【算法】超详细的遗传算法(Genetic Algorithm)解析 - 简书 (jianshu.com)原创 2021-07-02 20:37:03 · 187 阅读 · 0 评论 -
Datawhale练习之二手车价格预测
Datawhale练习之二手车价格预测_python_脚本之家 (jb51.net)原创 2021-07-01 17:16:44 · 104 阅读 · 0 评论 -
信贷风控审批中的决策否决管理
信贷风控审批中的决策否决管理 - 知乎 (zhihu.com)原创 2021-07-01 09:39:37 · 130 阅读 · 0 评论 -
机器学习术语表
https://developers.google.cn/machine-learning/glossary/?hl=zh-CN#dropout_regularization原创 2021-07-01 08:30:06 · 154 阅读 · 0 评论 -
Gradient Boosting Machine总结
Gradient Boosting Machine总结 - 知乎 (zhihu.com)原创 2021-06-30 09:53:24 · 365 阅读 · 0 评论 -
如何用Python进行时间序列分解和预测
如何用Python进行时间序列分解和预测_python_脚本之家 (jb51.net)原创 2021-06-30 09:10:44 · 137 阅读 · 0 评论 -
模型中存在共线性问题,该怎么破?
模型中存在共线性问题,该怎么破? (qq.com)原创 2021-06-30 08:29:44 · 1212 阅读 · 0 评论 -
为什么条件Logit模型中没有常数项,以及,你的女神会不会不喜欢你?
为什么条件Logit模型中没有常数项,以及,你的女神会不会不喜欢你? (qq.com)原创 2021-06-25 08:41:37 · 1145 阅读 · 0 评论 -
效用最大化准则:离散选择模型的核心(二项Logit模型)——离散选择模型之九
效用最大化准则:离散选择模型的核心(二项Logit模型)——离散选择模型之九 (qq.com)原创 2021-06-24 21:28:07 · 983 阅读 · 0 评论 -
效用最大化准则:离散选择模型的核心(Probit模型上篇)——离散选择模型之七
效用最大化准则:离散选择模型的核心(Probit模型上篇)——离散选择模型之七 (qq.com)原创 2021-06-24 11:31:49 · 886 阅读 · 0 评论 -
正确打开/解读Logit模型系数的方式——离散选择模型之四
正确打开/解读Logit模型系数的方式——离散选择模型之四 - 知乎 (zhihu.com)原创 2021-06-24 10:59:43 · 1401 阅读 · 0 评论 -
Logit究竟是个啥?——离散选择模型之三
Logit究竟是个啥?——离散选择模型之三 - 知乎 (zhihu.com)原创 2021-06-24 10:22:18 · 756 阅读 · 0 评论 -
路径规划五种算法简述及对比
以下是本人在学习路径规划过程中的一些总结,借着机会写了一下,有不妥之处欢迎批评指正,谢谢。路径规划部分在无人车架构体系当中分属控制或决策部分,如图1,是实现无人化驾驶的关键技术之一。路径规划模块性能的高低直接关系车辆行驶路径选择的优劣和行驶的流畅度,而路径规划算法的性能优劣很大程度上取决于规划算法的优劣,如何在各种场景下迅速、准确的规划出一条高效路径且使其具备应对场景动态变化的能力是路径规划算法应当解决的问题。图 0.1根据对环境信息的把握程度可把路径规划划分为基于先验完全信息的全局路径规划原创 2021-06-02 13:44:09 · 5252 阅读 · 0 评论 -
超全汇总!机器学习常用术语词汇表——下篇(建议收藏)
NNaN 陷阱 (NaN trap)模型中的一个数字在训练期间变成NaN,这会导致模型中的很多或所有其他数字最终也会变成 NaN。NaN 是“非数字”的缩写。负类别 (negative class)在二元分类中,一种类别称为正类别,另一种类别称为负类别。正类别是我们要寻找的类别,负类别则是另一种可能性。例如,在医学检查中,负类别可以是“非肿瘤”。在电子邮件分类器中,负类别可以是“非垃圾邮件”。另请参阅正类别。神经网络 (neural network)一种模型,灵感来...原创 2021-05-28 12:42:12 · 1174 阅读 · 0 评论 -
路径规划 | 图搜索算法:DFS、BFS、GBFS、Dijkstra、A*
路径规划 | 图搜索算法:DFS、BFS、GBFS、Dijkstra、A* - 知乎 (zhihu.com)原创 2021-05-26 15:18:36 · 508 阅读 · 0 评论 -
局部搜索算法总结
通常考察一个算法的性能通常用局部搜索能力和全局收敛能力这两个指标。局部搜索是指能够无穷接近最优解的能力,而全局收敛能力是指找到全局最优解所在大致位置的能力。局部搜索能力和全局搜索能力,缺一不可。向最优解的导向,对于任何智能算法的性能都是很重要的。局部最优问题(或叫局部峰值局部陷井):现实问题中,f在D上往往有多个局部的极值点。一般的局部搜索算法一旦陷入局部极值点,算法就在该点处结束,这时得到的可能是一个糟糕的结果。解决的方法就,目标函数差的点,被选中的概率小。考虑归一化问题,使得邻域内所有点被...原创 2021-05-26 06:10:49 · 4656 阅读 · 1 评论 -
语音处理的分帧,帧移,加窗,滤波,降噪,合成概念理解
一、分帧语音数据和视频数据不同,本没有帧的概念,但是为了传输与存储,我们采集的音频数据都是一段一段的。为了程序能够进行批量处理,会根据指定的长度(时间段或者采样数)进行分段,结构化为我们编程的数据结构,这就是分帧。二、帧移由于我们常用的信号处理方法都要求信号是连续的,也就说必须是信号开始到结束,中间不能有断开。然而我们进行采样或者分帧后数据都断开了,所以要在帧与帧之间保留重叠部分数据,以满足连续的要求,这部分重叠数据就是帧移。三、加窗介绍帧移的时候我们说了,我们处理信号的方法都要求信号是原创 2021-05-19 08:58:46 · 1598 阅读 · 0 评论 -
机器学习分类算法(附图文详解)
说起分类算法,相信学过机器学习的同学都能侃上一二。可是,你能够如数家珍地说出所有常用的分类算法,以及他们的特征、优缺点吗?比如说,你可以快速地回答下面的问题么:KNN算法的优缺点是什么? Naive Bayes算法的基本假设是什么? entropy loss是如何定义的? 最后,分类算法调参常用的图像又有哪些?答不上来?别怕!一起来通过这篇文章回顾一下机器学习分类算法吧(本文适合已有机器学习分类算法基础的同学)。机器学习是一种能从数据中学习的计算机编程科学以及艺术,就像下面这句话说得原创 2021-04-22 08:12:20 · 3295 阅读 · 0 评论 -
数据仓库建模
1、为什么需要为数据仓库建模进行全面的业务梳理时,我们可以通过业务模型,全面了解业务结构及运行情况,按照业务特定的规律分门别类和程序化,改进业务的流程。通过模型的建设,我们可以很清晰的看到数据之间内在的关联关系,从而建立起全方位的数据视角,并消灭信息孤岛和数据差异化的问题,进而保证数据的一致性。模型可以很好的帮助我们分离出底层技术的实现和上层业务的展现,当上层业务发生变化时,通过数据模型,底层的技术实现可以适应的了业务的变动,进而解决数据库的灵活性。在模型中可以很好的看出开发人员和业务人员之原创 2021-01-09 19:51:10 · 214 阅读 · 0 评论 -
reddit 推荐算法 的一半 的解读 新手向
http://www.ruanyifeng.com/blog/2012/03/ranking_algorithm_reddit.html原创 2020-12-29 16:37:59 · 320 阅读 · 0 评论 -
0-1搭建用户画像系统的设计思路
一、需求目的①、商城已上线2周年,已有10万+在售物品。数据仓库中积累着大量的业务数据、日志数据及埋点数据。如何充分挖掘沉淀在数据仓库中的数据的价值,有效的支持用户画像的建设,成为当前的重要工作。②、在保证用户规模不断增长的目标下,运营方考虑建立用户流失预警机制,及时识别将要流失的用户群体,及时采取运营策略换回用户。二、产品结构三、用户画像系统搭建流程目前团队已经搭建了比较成熟的数据仓库。也就是说已经有结构化的、清晰的用户属性、用户行为相关数据。在此基础上,搭建用户画像系统,需要:原创 2020-12-28 17:53:52 · 413 阅读 · 0 评论 -
tableau完整案例:使用集值做互动分析
一、数据一览与客户需求在真实的业务场景中,分析始于问题、始于需求,而非开始于数据。所以千万不要拿到数据着急寻找珍珠,否则往往是越看越纠结。我拿到的数据是仅一分钟内的传感器数据,对方临时生成的数据,明显数据结构并非完美,原表中同时包含了原始数据和二次加工的分析数据。对方想要查看的视图,一是左上角分析字段在60秒的波动情况,二是在每秒1000次(专业术语大概是1000Hz)的数值波动,查看波峰波谷,这里分为原始数据和傅里叶数据两种,每秒可以视为一个系列。客户之前使用Excel做了一个模拟,同时展示三原创 2020-12-07 08:27:05 · 989 阅读 · 0 评论 -
【Tableau图表】二维条形码图(Barcode plot)
将销售额字段拖放至列功能区,并调整为维度 将地区字段拖放至行功能区 调整一下颜色标记卡的透明度 为了集中趋势效果好,我将坐标轴,改成了对数轴二维条形码的效果就出来了。为了展示与分析效果,给单元格添加一个平均线。总结一下,其实就是对度量数据不要进行汇总,把所有数据按照坐标位置进行排放。 虽然没有调整默认的图表类型设定,但要注意,图表类型是甘特图。...原创 2020-12-04 04:20:46 · 722 阅读 · 0 评论 -
python 基础面向对象
数据挖掘Python基础之面向对象前言之前我们已经学习了Python基本的数据类型,函数与文件读写,接下来我们就来看看Python的面向对象的编程,如果学过类似于Java这种面向对象的编程语言,学起来对比Python的面向对象就会感觉十分的容易,作为一门脚本语言,Python在面向对象方面相较于java更加简洁和方便,少了很多的约束。创建对象和其他语言一样Python使用class关键字来声明一个类,类名采用驼峰命名法,首字母大写。classAnimal:def__i...原创 2020-12-01 16:11:50 · 272 阅读 · 0 评论 -
python re.split 用法
问题:s = '1,2,3,4,a,5,6,7,8,b,9,10,11,12' ['1,2,3,4', '5,6,7,8', '9,10,11,12']要想将上述字符串按要求进行分割,意味着分隔符为',a,'和',b,':针对上述情况,要想利用str.split()取得想要的结果,就要费点劲了,具体实现可见文末;这时,就可以利用re.split()方法了import res = '1,2,3,4,a,5,6,7,8,b,9,10,11,12' re.split(',..原创 2020-12-01 15:05:37 · 2923 阅读 · 0 评论 -
python 一个决策树分析的案例
#23 pythoh descison treefrom sklearn.feature_extraction import DictVectorizerimport csvimport pandas as pdfrom sklearn import preprocessingfrom sklearn import treefrom sklearn.externals.six import StringIOdata1=pd.read_csv('D://allelectronics.csv'.原创 2020-11-30 15:29:20 · 453 阅读 · 0 评论 -
数据分析, 2020年业绩指标如何预测?
https://cloud.tencent.com/developer/article/1556818原创 2020-11-29 14:17:32 · 482 阅读 · 0 评论 -
python print 函数 高级应用
print() 函数的详细语法格式如下:print (value,...,sep='',end='\n',file=sys.stdout,flush=False)从上面的语法格式可以看出,value 参数可以接受任意多个变量或值,因此 print() 函数完全可以输出多个值。例如如下代码:user_name = 'Charlie' user_age = 8 #同时输出多个变量和字符串 print("读者名:",user_name,"年龄:",user_age)运行上面代码,可以.原创 2020-11-08 07:26:18 · 231 阅读 · 0 评论 -
dataframe 多个列求和(很多列情况)
你可以只需sum并设置paramaxis=1来对行进行求和,这将忽略无数字列:In [91]:df = pd.DataFrame({'a': [1,2,3], 'b': [2,3,4], 'c':['dd','ee','ff'], 'd':[5,9,1]})df['e'] = df.sum(axis=1)dfOut[91]: a b c d e0 1 2 dd 5 81 2 3 ee 9 142 3 4 ff 1 8如果您只想.原创 2020-11-07 19:39:54 · 12828 阅读 · 0 评论 -
Tableau 上下文过滤器
Tableau中的正常过滤器彼此独立。这意味着每个过滤器从源数据读取所有行,并创建自己的结果。但是在某些情况下,我们希望第二个过滤器只处理第一个过滤器返回的记录。因此,在这种情况下,第二个过滤器称为依赖过滤器,因为它们只处理通过上下文过滤器的数据。上下文过滤器有两个主要目的。提高性能- 如果设置了大量过滤器或具有大型数据源,查询可能会很慢。您可以设置一个或多个上下文过滤器以提高性能。 创建从属数字或前N个过滤器- 您可以设置上下文过滤器以仅包括感兴趣的数据,然后设置数字或前N个过滤器。创建上下文..原创 2020-11-07 02:58:29 · 919 阅读 · 0 评论 -
Tableau交叉表图表
交叉表图表也称为文本表,以文本形式显示数据。交叉表图表采用一个或多个维度以及一个或多个度量。此图表还可以显示度量字段值的不同计算,例如总百分比,运行总计等。例如,如果要查找每个区域中每个细分的销售数量,请考虑数据源:Sample-Superstore。要使用下面的可用订单日期显示每年的数据,请参阅创建交叉表图表的一些步骤。第1步:将维度订单日期拖到列架中。第2步:此外,将维度Region和Segment 拖动到行架子中。第3步:将度量Sales 拖到“标记(Labels)”窗格下的“标签原创 2020-10-25 18:20:13 · 2443 阅读 · 0 评论