- 博客(12)
- 资源 (5)
- 收藏
- 关注
原创 task2 pandas_索引
第2章 索引In[1]:import numpy as npimport pandas as pddf = pd.read_csv('data/table.csv',index_col='ID')df.head()Out[1]: School Class Gender Address Height Weight...
2020-04-24 21:52:25 211
原创 task2 贝叶斯
生成模型在概率统计理论中, 生成模型是指能够随机生成观测数据的模型,尤其是在给定某些隐含参数的条件下。它给观测值和标注数据序列指定一个联合概率分布。在机器学习中,生成模型可以用来直接对数据建模(例如根据某个变量的概率密度函数进行数据采样),也可以用来建立变量间的条件概率分布。条件概率分布可以由生成模型根据贝叶斯定理形成。常见的基于生成模型算法有高斯混合模型和其他混合模型、隐马尔可夫模型、随机上...
2020-04-23 22:13:24 237
原创 Task01 线性回归
1、线性回归的原理2、线性回归损失函数、代价函数、目标函数3、优化方法(梯度下降法、牛顿法、拟牛顿法等)4、线性回归的评估指标5、sklearn参数详解一、线性回归的原理二、线性回归损失函数、代价函数、目标函数损失函数(Loss Function):度量单样本预测的错误程度,损失函数值越小,模型就越好。 代价函数(Cost Function):度量全部样本集的平均...
2020-04-21 16:17:29 184
原创 第1章 Pandas基础
一、基础知识1、读取:df = pd.read_csv('data/table.csv')2、写入:df.to_csv('data/new_table.csv')【可用于结果输出】二、基本数据结构series && dataframeseries的属性:.values;.name.index.dtypeseries方法:mean(...
2020-04-20 22:06:15 444
原创 Datawhale 零基础入门数据挖掘-Task5 模型融合
5.1 模型融合目标¶ 对于多种调参完成的模型进行模型融合。 完成对于多种模型的融合,提交融合结果并打卡。 5.2 内容介绍模型融合是比赛后期一个重要的环节,大体来说有如下的类型方式。简单加权融合: 回归(分类概率):算术平均融合(Arithmetic mean),几何平均融合(Geometric mean); 分类:投票(Voting) 综合:排序融合(Ra...
2020-04-03 22:21:54 121
原创 Datawhale 零基础入门数据挖掘-Task4 建模调参
4.1 学习目标了解常用的机器学习模型,并掌握机器学习模型的建模与调参流程 完成相应学习打卡任务4.2 内容介绍线性回归模型: 线性回归对于特征的要求; 处理长尾分布; 理解线性回归模型; 模型性能验证: 评价函数与目标函数; 交叉验证方法; 留一验证方法; 针对时间序列问题的验证; 绘制学习率曲线; 绘制验证曲线; 嵌入式特征选择: La...
2020-04-01 19:56:48 112
原创 Datawhale 零基础入门数据挖掘-Task3 特征工程
【图片内容链接参考:http://www.360doc.com/content/18/0329/21/11935121_741356590.shtml】3.1什么是特征工程,为什么要进行特征工程?特征工程是比赛中最至关重要的的一块,特别的传统的比赛,大家的模型可能都差不多,调参带来的效果增幅是非常有限的,但特征工程的好坏往往会决定了最终的排名和成绩。特征工程的主要目的还是在于将数...
2020-03-28 15:47:49 237
原创 Datawhale 零基础入门数据挖掘-Task2 数据分析
二、 EDA-数据探索性分析2.1 EDA目标 EDA的价值主要在于熟悉数据集,了解数据集,对数据集进行验证来确定所获得数据集可以用于接下来的机器学习或者深度学习使用。 当了解了数据集之后我们下一步就是要去了解变量间的相互关系以及变量与预测值之间的存在关系。 引导数据科学从业者进行数据处理以及特征工程的步骤,使数据集的结构和特征集让接下来的预测问题更加可靠。 ...
2020-03-24 15:08:43 415
原创 Datawhale 零基础入门数据挖掘-Task1 赛题理解
本次新人赛是Datawhale与天池联合发起的0基础入门系列赛事第一场 —— 零基础入门数据挖掘之二手车交易价格预测大赛。1、赛题背景赛题以二手车市场为背景,要求选手预测二手汽车的交易价格,这是一个典型的回归问题。通过这道赛题来引导大家走进AI数据竞赛的世界,主要针对于于竞赛新人进行自我练习、自我提高。2、赛题数据赛题以预测二手车的交易价格为任务,数据来自某交易平台的二手...
2020-03-24 13:19:32 300
原创 数据结构——栈:栈的应用:表达式求值
前缀表达式的计算机求值从右至左扫描表达式,遇到数字时,将数字压入堆栈,遇到运算符时,弹出栈顶的两个数,用运算符对它们做相应的计算(栈顶元素 op 次顶元素),并将结果入栈;重复上述过程直到表达式最左端,最后运算得出的值即为表达式的结果例如:- × + 3 4 5 61. 从右至左扫描,将6、5、4、3压入堆栈2. 遇到+运算符,因此弹出3和4(3为栈顶元素,4为次顶元素,注意与后缀表达式做比较)...
2018-06-12 16:00:25 2863
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人