sd3145265-CSDN博客

原创用NumPy快速处理数据（学习笔记）

Python科学计算：用NumPy快速处理数据(学习笔记)目录Python科学计算：用NumPy快速处理数据(学习笔记)前言使用 NumPy 让你的 Python 科学计算更高效ndarray 对象创建数组结构数组ufunc 运算连续数组的创建算数运算统计函数计数组 / 矩阵中的最大值函数 amax()，最小值函数 amin()统计最大值与最小值之差 ptp()统计数组的百分位数 percentile()统计数组中的中位数 median()、平均数 mean()统计数组中的加权平均值 average()统

2020-10-26 22:40:07 454

转载逻辑斯谛回归模型处理Kaggle泰坦尼克号之灾

目录0 前言1 数据初探2 探索性数据分析(EDA)2.1 乘客各属性分布2.2 属性与获救结果的关联统计3 数据预处理4 逻辑斯蒂回归建模5 逻辑斯蒂回归系统优化5.1 模型关联系数分析5.2 交叉验证6 learning curves7 模型融合(model ensemble)8 总结0 前言【声明】本文主要是实现一遍寒小阳相关博客的代码，由于原文已经有一定历史，由于版本更新，有些代码不再适用，本文在此做了修改；另外本文还对其中一些知识点做了解释和拓展。【原文相关信息】作者：寒小阳时间：20

2020-10-12 21:56:31 1773 1

转载 MySQL: win10安装MySQL 8.0.21成功记录【转载】

參考博客原址：https://blog.csdn.net/lcqin111/article/details/107577249?utm_medium=distribute.pc_relevant.none-task-blog-BlogCommendFromMachineLearnPai2-1.channel_param&depth_1-utm_source=distribute.pc_relevant.none-task-blog-BlogCommendFromMachineLearnPai2-1.

2020-10-10 19:05:00 382

原创《统计学习方法第二版》学习笔记3——K近邻法

第三章 k近邻法目录第三章 k近邻法前言1 理论部分1.1 k近邻算法1.2 k近邻模型1.2.1 模型1.2.2 距离度量1.2.3 k值的选择1.2.4 分类决策规则1.3 k近邻法的实现：kd树1.3.1 构造kd树1.3.2 搜索kd树2 代码部分2.1 距离度量2.2 课本例3.12.3 scikit-learn实例2.4 sklearn.neighbors.KNeighborsClassifier2.5 kd树2.6 构造平衡kd树算法2.7 例3.2前言【导读】k近邻法(k-NN)是一种

2020-10-02 20:36:09 630

原创《统计学习方法第二版》学习笔记2——感知机

第2章感知机目录第2章感知机前言1 理论部分2.1 感知机模型前言本文主要参考资料：《统计学习方法》第二版李航《统计学习方法》第二版PPT 袁春1 理论部分【导读】本章的结构按着统计学习方法三要素——模型、策略、算法来进行安排。感知机是我们正式学习的第一个模型，算是一个比较简单基础的的二分类的线性分类模型。主要内容依然是用思维导图展示，强调知识体系结构。此外，由于我们后面学习的模型很多，我们要重点弄清每个模型的具体应用场景和优缺点。链接：https://pan.baidu.

2020-09-13 22:46:32 384

原创《统计学习方法第二版》学习笔记1——概论

第1章统计学习及监督学习概率论目录第1章统计学习及监督学习概率论前言1 理论部分1.1 统计学习1.2 统计学习的分类1.3 统计学习方法三要素1.4 模型评估与模型选择1.5 正则化与交叉验证1.6 泛化能力1.7 生成模型与判别模型1.8 监督学习应用前言本文主要参考资料：《统计学习方法》第二版李航《统计学习方法》第二版PPT 袁春这次学习笔记主要记录《统计学习方法》的一些重要知识点及其拓展、相关代码实现和一些思考，起因是我们可爱美丽的V同学发动的组队学习打卡活动。本人并非计

2020-09-07 00:21:39 1145

原创 datawhale课程[动手学数据分析]——Task05：模型搭建与评价

目录第三章模型搭建和评估--建模模型搭建任务一：切割训练集和测试集任务提示1任务二：模型创建提示任务三：输出模型预测结果提示3第三章模型搭建和评估-评估模型评估任务一：交叉验证提示4思考4任务二：混淆矩阵提示5任务三：ROC曲线提示6思考6第三章模型搭建和评估–建模经过前面的两章的知识点的学习，我可以对数数据的本身进行处理，比如数据本身的增删查补，还可以做必要的清洗工作。那么下面我们就要开始使用我们前面处理好的数据了。这一章我们要做的就是使用数据，我们做数据分析的目的也就是，运用我们的数据以及结合

2020-08-27 22:13:11 638

原创 datawhale课程[动手学数据分析]——Task04：数据可视化

目录2 第二章：数据可视化开始之前，导入numpy、pandas以及matplotlib包和数据2.7 如何让人一眼看懂你的数据？2.7.1 任务一：跟着书本第九章，了解matplotlib，自己创建一个数据项，对其进行基本可视化2.7.2 任务二：可视化展示泰坦尼克号数据集中男女中生存人数分布情况（用柱状图试试）。2.7.3 任务三：可视化展示泰坦尼克号数据集中男女中生存人与死亡人数的比例图（用柱状图试试）。2.7.4 任务四：可视化展示泰坦尼克号数据集中不同票价的人生存和死亡人数分布情况。（用折线图试试

2020-08-26 11:53:53 1056

原创 datawhale课程[动手学数据分析]——Task03：数据重构

目录开始之前，导入numpy、pandas包和数据2 第二章：数据重构2.4 数据的合并2.4.1 任务一：将data文件夹里面的所有数据都载入，观察数据的之间的关系2.4.2：任务二：使用concat方法：将数据train-left-up.csv和train-right-up.csv横向合并为一张表，并保存这张表为result_up2.4.3 任务三：使用concat方法：将train-left-down和train-right-down横向合并为一张表，并保存这张表为result_down。然后将上边的

2020-08-24 00:40:00 730

原创 datawhale课程[动手学数据分析]——Task02：数据清洗简述

目录2 第二章：数据清洗及特征处理2.1 缺失值观察与处理2.1.1 任务一：缺失值观察2.1.2 任务二：对缺失值进行处理2.2 重复值观察与处理2.2.1 任务一：请查看数据中的重复值2.2.2 任务二：对重复值进行处理2.2.3 任务三：将前面清洗的数据保存为csv格式2.3 特征观察与处理2.3.1 任务一：对年龄进行分箱（离散化）处理2.3.2 任务二：对文本变量进行转换2.3.3 任务三：从纯文本Name特征里提取出Titles的特征(所谓的Titles就是Mr,Miss,Mrs等)附加题【回

2020-08-21 23:42:14 459

原创 datawhale课程[动手学数据分析]——Task01：数据加载及探索性数据分析

目录0 前言1 数据加载1.1 载入数据1.1.1 任务一：导入numpy和pandas1.1.2 任务二：载入数据1.1.3 任务三：每1000行为一个数据模块，逐块读取1.1.4 任务四：将表头改成中文，索引改为乘客ID [对于某些英文资料，我们可以通过翻译来更直观的熟悉我们的数据]1.2 初步观察1.2.1 任务一：查看数据的基本信息1.2.2 任务二：观察表格前10行的数据和后15行的数据1.2.4 任务三：判断数据是否为空，为空的地方返回True，其余地方返回False1.3 保存数据1.3.1

2020-08-19 21:52:11 942

sd3145265的博客