自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(3)
  • 收藏
  • 关注

原创 数据挖掘基础学习(1)数据清洗:重复值、缺失值、异常值处理

本文暂不讨论数据类型转换、离散变量重编码、冗余信息及无意义信息处理方法,仅先从最基本数据清洗规则:重复值、缺失值、异常值处理角度入手进行讨论,其余部分内容将在后期进行说明注:本文讨论内容基于Python语言,处理对象为常规pandas读取数据表格格式Dataframe。

2022-09-30 17:12:12 3508 1

原创 数据分析基础(1)SQL关键词JOIN的使用思考

一、JOIN关键字菜鸟教程上对JOIN关键词的功能定义为“把来自两个或多个表的行结合起来,基于这些表之间的共同字段”。从具体使用上进行更细的划分,JOIN对进行连接两表的连接操作,根据记录的保留,可以分为如下七种:这七种连接方式,归根到底还是通过对“INNER JOIN”、“LEFT JOIN”、“RIGHT JOIN”以及“FULL OUTER JOIN”使用的变形。下面我们仅对“LEFT JOIN”进行讨论二、JOIN关键字的用法...

2022-04-06 12:55:22 518

原创 数据挖掘模型学习(1)贝叶斯模型

文中核心内容源于对刘顺祥先生所著《从零开始学python数据分析与挖掘》学习的总结和笔者本人对相关内容查询补充。一.学习准备1:条件概率公式与全概率公式 首先是条件概率公式: 该公式适用于计算事件A已经发生的情况下事件B发生的概率,P(AB)表示事件A与事件B同时发生的概率,其满足概率乘法公式: 对于事件A,我们假设存在并行的具有n种可能的完备事件组: 结合条件概率公式和概率乘法公式,我们可以得到事件A的全概率公式...

2022-03-31 17:04:51 6622

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除