自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(16)
  • 收藏
  • 关注

原创 DAX函数之Calculate函数

DAX函数之Calculate函数:https://www.jianshu.com/p/d07b257d3590语法:CALCULATE(,…)第一个参数是计算表达式,可以执行各种聚合运算(或者含有聚合函数的度量值)从第二个参数开始,是一系列筛选条件,可以为空;如果多个筛选条件,用逗号分隔重点:结合ALL函数,扩大上下文:ALL(‘产品明细’)的意思是清除产品明细表里的所有筛选,外部筛选器不起作用了,每行统计的都是该表中的所有产品。ALL函数简单理解为从整体中取筛选满足的表达式...

2021-02-23 21:10:14 1524

原创 Excel 中的查找替换功能

Excel 中的查找替换功能:https://zhuanlan.zhihu.com/p/143578009查找替换:将 0 替换为空值control + H 调出查找替换的窗口空值在键盘中输出一个空格就可以但是以上会出现一个问题,将内容中为 0 的给替换掉但我们希望是将单元格中为 0 的替换需要在选项中勾选单元格匹配...

2021-02-23 20:37:24 216

原创 Pytorch基本使用

深度学习初识通过案列:即咱们只传入一些基础的特征,让我们的模型自己去训练,不断的组合一些新的高级的特征,从而去判定最后的结果。这个结果需要我们定义好损失函数之后,不断的去更新里面的参数,使损失函数的值降到最低。当我们来一定新的特征的时候,很方便的去判断最后的结果。深度学习介绍深度学习是机器学习的一个子领域所有的深度学习算法都是深度神经网络机器学习和深度学习的区别2.1 区别1 ...

2020-01-13 17:09:25 292

原创 聚类算法

聚类:分类算法回归算法属于监督学习非监督学习(无监督学习)数据集合:没有目标值聚类算法:特征值根据样本的相似度,把样本聚成簇使用不同的聚类准则(相似度指标),产生的聚类结果不同。应用:用户画像图像分割(图像的RDB三元素不同来对图像进行聚类)聚类算法api初步使用:kmeans算法 k平均聚类算法sklearn.cluster.KMeans(n_clusters=8)...

2019-12-03 15:49:46 489

原创 集成学习

集成学习:一种思想,指导着一套算法的学习弱学习器 60%强学习器 99%多个弱学习器组合在一起,最终达到比单独一个强学习器还要好的效果一个算法 80%boosting: 弱弱增强,解决欠拟合的问题bagging: 每一个模型都容易过拟合,相互遏制,稳定性变强(robust),泛化能力增强3个 分类结果建立几个模型来解决单一预测问题这些预测最后结合成组合预测,因此优于...

2019-12-03 15:49:12 123

原创 决策树

决策树算法:分类算法:​ 目标值​ 离散型特征值:离散型[如这里的字符串类型的特征值] 将特征值为离散型的数值转化为数值型‘1st’‘2nd’‘3rd’在pandas里面数据离散化采用:one-hot编码####决策树算法去关心的两个问题:1 结果(目标值)纯度问题2 如何选择最优划分指标 --> 让我们结果尽可能的简单纯粹纯度 :{...

2019-11-25 21:51:39 169

原创 Linear_Regression

线性回归+逻辑回归:算法学习的方式:名字算法类型白话原理api具体数学推理线性回归回归算法目标值是连续的2.1 线性回归简介回归方程(函数)对一个或多个自变量(特征值)和因变量(目标值)之间关系进行建模y = w1x1 + w2x2 + w3x3 + b非线性关系插值法:(纯数学解决方法,无意义,因为不具有泛化性)2.2 线性回归api初步使用sklearn...

2019-11-16 20:00:34 184

原创 Naive_Bayes

朴素贝叶斯概念直观理解:验证每一个类别中,样本特征的分布情况,根据新样本中特征的分布情况预测属于每一个类别的概率,输出概率最大的类别,我们就认为这个样本属于这个类别。案列:早起咱们的Yahoo做垃圾邮件的分类,就使用的是咱们的朴素贝叶斯几个比较常见的概率基础知识:条件概率是指事件A在事件B发生的条件下发生的概率P(A∣B)=P(AB)P(B)P(A | B)=\frac{P(A B)...

2019-11-13 15:57:07 110

原创 KNN算法总结

K-近邻算法【总体】 分类算法:​ 有目标值,离散型一个样本在特征空间中的k个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别,则该样本也属于这个类别。k:(本身取值对算法有影响,又不能通过算法训练确定值的变量叫做超参数)距离:scikit-learn:机器学习工具k近邻的sklearn的实现:sklearn.neighbors.KNeighborsClass...

2019-11-05 10:38:26 423

原创 数据分析入门--pandas

dataframe索引设置2.3.1 修改行列索引值data.index = stu2.3.2 重设索引df.reset_index() # 默认把索引的值变成一列数据,索引恢复默认索引drop=True,删掉索引2.3.3 以某列值设置为新的索引df.set_index(‘列名’)df.set_index([‘列名’, ‘列名1’])year month sale201...

2019-10-29 17:45:35 143

原创 数据分析入门 --numpy

fig, axes = plt.subplots(nrows=2, ncols=2, figsize=(20, 8), dpi=100)axes[0][0] # 坐标系设置刻度set_xticks([number])set_xticklabels([str_list])折线图能够显示数据的变化趋势plt.plot()散点图两个量之间是否存在线性关系plt.scatter()...

2019-10-29 17:44:18 182

原创 数据分析入门 -- matplotlib

matplotlib 绘图库numpy 科学计算库(大量数学运算,矩阵)pandas 表格处理神器(numpy和matplotlib的综合升级版)人工智能大致了解机器学习的工作流程1.1 人工智能大致了解场景用数据能够容易描述清楚,用机器学习不能容易的用数据描述清楚,用深度学习人工智能三要素数据算法计算力cpu: 核心数少,干活快gpu: 核心数多,干活慢1.2 人工智...

2019-10-29 17:40:39 271

原创 树的应用

数据结构与算法day04归并排序:分治法的一个非常典型的应用 归并排序的思想就是先递归分解数组,再合并数组。关键在于合并操作的时候让其有序,而咱们分开操作并未有序排列。归并排序得到的是一个新的列表,而不是像之前的排序算法一样,实在原有的基础上进行的操作最优时间复杂度:O(nlogn)最坏时间复杂度:O(nlogn)稳定性:稳定二分法查找:两种实现方式:递归方式与非递归的方式...

2019-10-29 17:33:10 384

原创 栈和队列的区别

数据结构与算法 day03栈:特点:只能允许在容器的一端(可以是尾端也可以是头部)进行加入元素,相当于对咱们线性表的进一步封装后进先出(LIFO, Last In First Out)的原理运作队列:队列(queue)是只允许在一端进行插入操作,而在另一端进行删除操作的线性表允许插入的一端为队尾,允许删除的一端为队头。注意:倘若咱们定义一个列表,从列表的头部添加元素,那么就只能从列表...

2019-10-29 17:30:24 244

原创 链表的操作

数据结构与算法day02单链表:每个节点包含两个域,一个信息域(元素域)和一个链接域。这个链接指向链表中的下一个节点,而最后一个节点的链接域则指向一个空值。链表与顺序表的各种操作复杂度如下所示:操作链表顺序表访问元素O(n)O(1)在头部插入/删除O(1)O(n)在尾部插入/删除O(n)O(1)在中间插入/删除O(n)O(n)...

2019-10-29 17:29:00 110

原创 算法的复杂度理解

数据结构与算法day01初步理解数据结构与算法相当于咱们作战时候的兵法这是咱们程序员开发的基本功,但需要日积月累才能够得到成长算法的概念:算法是独立存在的一种解决问题的方法和思路算法是计算机处理信息的本质,因为计算机程序本质上是一个算法来告诉计算机确切的步骤来执行一个指定的任务。算法的五大特性:输入: 算法具有0个或多个输入(代表是否需要一些额外的输入)输出: 算法至少有1个...

2019-10-29 17:06:15 448

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除