- 博客(4)
- 收藏
- 关注
原创 第四章 分组操作的SAC过程
第四章 分组操作的SAC过程概要splitapply 概要 分组操作的SAC过程是利用Pandas进行数据分析的基础之一,而SAC指的是分组操作中的split-apply-combine过程,其中: split指基于某一些规则,将数据拆成若干组 apply是指对每一组独立地使用函数 combine指将每一组的结果组合成某一类数据结构 split SAC的基础是分组(split),分组最常用的函...
2020-04-26 23:55:41 313
原创 第二章 超好用的Pandas索引(上)
0 前言 索引,相当于一本书的目录,告知读者XX内容在一本书的位置。同样地,Pandas索引用于定位特定元素的位置,也用于获取特定位置的元素。 总的来说,可将Pandas索引分为一级索引和多级索引。 1 一级索引 一级索引可归结为四种: 1.1 loc方法、iloc方法、[]操作符 最常用的索引方法可能就是这三类,其中iloc表示位置索引,loc表示标签索引,[]也具有很大的便利性,各有特点。 1...
2020-04-23 23:19:45 148
原创 第一章 线性回归
损失函数(Loss Function):度量单样本预测的错误程度,损失函数值越小,模型就越好。 代价函数(Cost Function):度量全部样本集的平均误差。 目标函数(Object Function):代价函数和正则化函数,最终要优化的函数。 某种程度下,损失函数和代价函数是等价的,都是用来衡量模型拟合程度,即衡量模型的预测值与实际值之间的差距。常用的损失函数包括:0-1损失函数、平方损失函...
2020-04-21 23:49:56 215
原创 第一章 Pandas基础综述
Pandas基础欢迎使用Markdown编辑器新的改变功能快捷键合理的创建标题,有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能,丰富你的文章UML 图表FLowchart流程图导出与导入导出导入 欢迎使用Mark...
2020-04-19 16:29:37 286
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人