自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(3)
  • 收藏
  • 关注

原创 生成模型 VS. 判别模型 Logistic 回归 VS. Softmax 回归

生成模型 VS. 判别模型从概率分布的角度考虑,对于一堆样本数据,每个均有特征Xi对应分类标记yi。生成模型:学习得到联合概率分布P(x,y),即特征x和标记y共同出现的概率,然后求条件概率分布。能够学习到数据生成的机制。判别模型:学习得到条件概率分布P(y|x),即在特征x出现的情况下标记y出现的概率。数据要求:生成模型需要的数据量比较大,能够较好地估计概率密度;而判别模型对数据样本量的...

2020-04-08 10:23:15 1705

原创 数据预处理

以字典作为columns参数使用rename来重命名列是我最喜欢的方式,因为它能同时为多个列重命名。如果想同时为所有的列重命名,下面这一小段代码会很有用。它以旧列名为键、空字符串为值,创建了一个字典:import collectionscolumn_names = collections.defaultdict(str)for name in df.columns: column...

2020-04-08 09:56:05 230

原创 数据分析项目 01

数据分析项目葡萄酒质量分析1.描述性统计2.分组、直方图与t 检验3.对变量之间的关系和相关性4.用最小二乘估计进行线性回归5.系数解释6.自变量标准化7.预测葡萄酒质量分析1.描述性统计下面先来分析葡萄酒质量数据集。首先,计算出每列的总体描述性统计量、质量列中的唯一值以及和这个唯一值对应的观测数量。使用pandas 的read_csv 方法将文本文件winequality-both.cs...

2020-04-02 22:33:44 732

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除