![](https://img-blog.csdnimg.cn/20201014180756928.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
pandas
文章平均质量分 68
最低调的奢华
忽有故人心上过,回首山河已是秋。
恍惚半生烂若泥,连哭都怕失了礼。
展开
-
标准化,归一化,二值化,One-Hot,卡方检验选取重要特征,主成分分析,缺失值和异常值处理
python特征处理和选择 缺失值异常值重复值处理,卡方检验,归一化标准,二值化,One-Hot编码等处理原创 2022-10-17 18:12:28 · 3011 阅读 · 7 评论 -
concat,merge表格的拼接,concatenate数组的拼接以及数组添加列和行
concat,merge,concatenate,数组等操作原创 2022-09-28 11:35:41 · 1518 阅读 · 0 评论 -
pandas中groupby分组
import numpy as npimport pandas as pd导入模块df1 = pd.DataFrame({'fruit':['apple','banana','orange','apple','banana'], 'color':['red','yellow','yellow','cyan','cyan'], 'price':[8.5,6.8,5.6,7.8,6.4]})df11.求苹果的平原创 2022-01-13 20:27:03 · 463 阅读 · 0 评论 -
pandas 一行代码获取数据
import pandas as pda = pd.read_html('https://s.askci.com/data/industry/a020905/')a原创 2021-12-30 23:51:27 · 643 阅读 · 0 评论 -
重复数据和缺失值的处理 , 离散化和面元划分,在表格中取出一列字符串,提取我们所需要的数据
1.重复数据的处理1.检测是否是重复数据(每一行中的饿每一列的数据都相同)data.duplicated()如果在后面加 keep=‘last’ 这个参数的话,保留后面的一条数据,如:data.duplicated(keep=‘last’)如果在后面加 inplace=True 这个参数的话,则在原数据上删除,如:data.drop_duplicates(inplace=True)2.检测有多少个重复数据data.duplicated().sum()3.检测某一原创 2021-12-23 21:37:37 · 665 阅读 · 0 评论 -
pandas数据结构下的Series以及DataFrame数据的增删改查以及创建
pandas的数据结构的介绍1.Series 对象的创建Series是一种一维的数组型对象,它包含了一个值序列(values),并且包含了数据标签,称为索引(index)pd.Series(data=None,index=None,dtype=None,name=None,copy=False)● data:创建数组的数据,可为array-like, dict, or scalar value● index:指定索引● dtype:数组数据类型● name:数组名称● copy:是否拷贝原创 2021-12-14 16:57:11 · 4003 阅读 · 0 评论