自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(7)
  • 收藏
  • 关注

原创 python数据预处理—数据清洗、数据集成、数据变换、数据归约

进行数据分析时,需要预先把进入模型算法的数据进行数据预处理。一般我们接收到的数据很多都是“脏数据”,里面可能包含缺失值、异常值、重复值等;同时有效标签或者特征需要进一步筛选,得到有效数据,最终把原始数据处理成符合相关模型算法的输入标准,从而进行数据分析与预测。

2022-09-13 23:54:37 10917

原创 python-seaborn库数据可视化{直方图、散点图、箱线图、变量关系图、热力图、条形图}

seaborn是在matplotlib的基础上进行了更加高级的封装,可以更加方便画出各种精美、方便分析数据的图表。本文主要将常见的6种{直方图、散点图、箱线图、变量关系图、热力图、条形图}进行一个学习总结说明,并附上代码及图片展示。这里附上绘画颜色所对应的英文字母,方便后续修改颜色配置。...

2022-08-31 16:31:00 1929

原创 python-sklearn数据分析-决策树(CART)分类(实战)

可以看到,该文件大小为61878*95,其中最后一列为目标标签;其中还发现该文件数据没有缺失值和重复值。最后一列是object类型,这里采用字典编码进行转换。相关可视化效果展示如下。

2022-08-30 19:53:02 3317 4

原创 python-sklearn数据分析-线性回归和支持向量机(SVM)回归预测(实战)

注:本文是小编学习实战心得分享,欢迎交流讨论!话不多说,直接附上代码和图示说明。目录一、分段示例1.导入必要的库2.读取数据,查看数据基本信息3.简单查看有无重复值4.对列名进行分类,便于后面的操作,其中最后一列为预测标签数据5.对数据进行初步可视化6.清除异常值7.将清洗完毕的数据,放进一个文件中8.特征选择9.数据归一化10.进行训练集与测试集划分11.线性回归模型训练12.使用支持向量机(SVM)进行回归预测二、完整代码2.读取数据,查看数据基本信息可以看到,该数据文件大小为731*7,具体

2022-08-29 23:09:18 18075 36

原创 python字典常见函数{clear(),copy(),fromkeys(),get(),items(),keys(),setdefault(),update(),values()}

函数介绍clear()删除字典内的所有项copy()对字典进行复制fromkeys()创建并返回新的字典,也可迭代对象中的元素分别作为字典中的键get()返回指定键的值items()以列表返回可遍历的(键/值)元组数组keys()以列表返回一个字典的所有键与get()函数类似,返回键的值;如果键不存在,添加该键,对应值设为默认值update()用于更新字典中的键值对,也可修改值或添加新的键值对values()以列表返回字典的所有值。......

2022-08-06 11:10:39 296 1

原创 python字符串常见基本操作(转义符、占位符)、字符串格式化(3种)、字符串常用方法(9种)

python字符串常见基本操作(转义符、占位符)、字符串格式化(3种)、字符串常用方法(9种){find(),join(),lower(),upper(),swapcase(),replace(),split(),strip(),translate()}

2022-08-02 12:15:15 2064 1

原创 Python列表增加和删除操作{insert(),append(),extend();del,pop(),remove(),clear()}

python列表增加和删除操作{insert(),append(),extend();del,pop(),remove(),clear()}

2022-07-31 17:10:59 916 2

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除