自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 收藏
  • 关注

原创 KNN算法数据归一化处理(持续更新中)

数据归一化处理公式:(每个值-最小值)/(最大值-最小值)数据归一化处理,不会改变数据原有的分布情况模拟的数据集data = [[-1,201],[-0.5,189],[0,199],[1,187],[1,200],[2,196]]data = pd.DataFrame(data)data手动处理以其中一列为例(具体根据业务场景)data[1] =(data[1]-data[1].min())/(data[1].max()-data[1].min())data使用sk

2021-05-07 18:39:02 1477

原创 matplotlib 绘图基础

matplotlib绘图散点图:plt.scatter()matploylib中的散点图可以单独控制每个散点与数据匹配,也可以让每个散点具有不同的属性。函数功能:寻找变量之间的关系调用签名:plt.scatter(x,y,c=“b”,label=“scatter figure”)参数说明:x:x轴上的数值y:y轴的数值c:散点图中的标记的颜色label:标记图形内容的标签文本柱状图:plt.bar()柱状图是描述统计中使用频率非常高的一种统计图形,主要应用在离散型数据的分布展

2021-05-02 14:07:56 261

原创 Pandas中关于文本处理和日期类型的学习记录

文本处理str 属性Series中与字符串相关的方法,封装在子模块下series.str.具体的方法- 具体可以通过- dir(pd.Series.str)查看常用的方法(以下用到的series值均表示为字符的值)- s.str.count(‘a’) 统计a在每一个series值中出现了多少次- s.str.split(sep = ‘’) 按照指定的分隔符拆分,指定分隔符不作为一个元素结果返回- s.str.partition(sep = ‘’) 按照指定的分隔符第一次出现的位置拆

2021-04-28 16:57:26 268

原创 Python中数据清洗缺失值,重复值和异常值的处理

1 缺失值的处理1.1 常规缺失值的处理np.nan,NaN,None,NaT(时间数据类型的缺失值)等df.isnull()1.判断每一个df中的数据是否为缺失值,是则返回True,否则返回False2.可以利用True为1,False为0的特性,sum()即为缺失值数量df.notnull()判断每个df中的值是否不为缺失值,是不为缺失值返回True,不是不为缺失值则返回Falsedf.dropna() 1.删除缺失值,可以指定axis来控制删除出现缺失值的行或者列 2.使用dropna

2021-04-28 14:27:18 2240 1

原创 Pandas中map,apply,applymap的简单介绍

函数的应用作用:我们可以自己定义一些函数,来应用到DataFrame或者Series中常用的函数:map:map 是Series中特有的方法,通过它可以对Series中的每个元素实现转换map 是映射函数,把一个函数的操作,映射到一个序列中的每一个元素中去映射方法:1.函数(包括自定义,lambda,内置,np,其他模块函数等均可)2.字典(独有)apply:既支持Series也支持DataFrame在对Series操作时,会作用到每个值上(和map相同)对DataF

2021-04-28 12:03:17 134

原创 Python 解决list无法创建列表的问题

Python 中无法使用list函数创建列表的解决方法今天遇到一个问题后来才发现,是我把list定义成了一个变量,少写了一个list1,结果更改了list()的定义,所以解决方法就是删除自己定义的list()执行即可恢复正常...

2021-04-27 13:03:38 672 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除