自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(7)
  • 收藏
  • 关注

原创 【python基础】多方法实现1-100累加求和

以下给出五种解题角度(for循环、while循环、列表推导式、reduce函数、递归函数)③列表推导式(直接利用sum函数)

2023-04-01 18:30:20 6425 2

原创 动手学数据分析 TASK5 数据建模与模型评估

第三章:数据建模与模型评估前言一、关键词概要二、内容复现(一) 数据建模1.数据载入及预设2.模型选择与sklearn算法(1)sklearn简介3.数据集划分4.模型搭建(1)创建基于线性模型的分类模型(逻辑回归)(2)创建基于树的分类模型(决策树、随机森林)5. 输出模型预测结果(二)模型评估1.交叉验证2.混淆矩阵3.ROC曲线参考文章前言经过前面的两章的知识点的学习,我们除了可以对数据的本身进行处理,比如数据本身的增删查补,还可以做必要的清洗工作,该过程可以统称为数据的预处理。这一章我们要做的就

2021-08-27 01:48:28 657

原创 动手学数据分析 TASK4 数据可视化

本篇主要展示数据可视化过程,数据基于此前经过清洗和重构的泰坦尼克号沉船乘客数据

2021-08-23 23:04:00 339

原创 动手学数据分析 TASK3 数据重构

本篇是用于记录第二章的第二小节,旨在实现数据重构,通过对数据整体的结构的变换调整、以达到分析不同层次、群体画像数据的目的。主要包括数据的合并和数据的属性方面聚合运算groupby等用法。开始前,导入numpy、pandas包和数据#导入基本库import numpy as npimport pandas as pd第二节 数据重构数据的合并2.4.1 载入数据观察数据间关系left_up = pd.read_csv("data/train-left-up.csv")left_down =

2021-08-21 18:30:19 256

原创 动手学数据分析 TASK2 数据清洗及特征处理

本篇主要解决数据清洗和数据的特征处理问题,数据清洗包括缺失值、重复值的处理、字符串数据转换等,此项过程为数据分析的前序环节起铺垫作用。2 第二章:数据清洗及特征处理知识概要 缺失值和重复值的观察与处理 数据的分箱处理 文本变量转换数据加载import numpy as npimport pandas as pddf = pd.read_csv('train.csv')2.1 缺失值观察与处理2.1.1 缺失值观察(1)查看每个特征缺失值个数>>>df.isn

2021-08-19 23:04:08 287

原创 动手学数据分析 TASK1 数据加载及探索性数据分析

该博文用于记录学习过程的要点,通过kaggle网站上泰坦尼克的任务为例实现数据分析全流程,同时熟悉Jupyter Notebook的基本操作1 第一节:数据载入及初步观察1.1 载入数据数据集来源: https://www.kaggle.com/c/titanic/overview下载得到’ train ’ ’ gender_submission '和 ’ test_1 '三份文件任务一:导入python库import numpy as npimport pandas as pdimport

2021-08-17 20:45:25 275

原创 Rsutdio读取R文件时中文注释出现乱码

Rsutdio读取R文件时中文注释出现乱码我下的是R最新版4.0.3,在用Rstudio读取已写好的R文件时,出现乱码,咨询后得知需要将编码改为utf-8,小小地记录一下。设置时,依次选择Tools-Global Option-Code-Saving在Default text encoding一栏修改为UTF-8即可选择完成,依次点击OK即可,再重新打开已有R文件...

2021-03-09 20:37:25 1824 4

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除