![](https://img-blog.csdnimg.cn/20201014180756926.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
Pandas知识问题
生产队的驴儿
一个人必须不停地写作,才能不被茫茫人海湮灭。
展开
-
Python set()函数
set()函数功能:创建一个无序不重复元素集例子:输入x = set('abca')print(x)结果原创 2021-08-25 22:48:47 · 235 阅读 · 0 评论 -
Python .index()函数
.index()函数语法:a.index(x[, start[, end]])参数:x: 查找的对象start 查找的起始位置end 查找的结束位置例子:a = [1, 'a', 'b', 'c']print(a.index('a'))1原创 2021-08-25 22:43:53 · 5414 阅读 · 0 评论 -
pandas缺失值填充
pandas缺失值填充作用: 填充缺失值DataFrame.fillna(value=None, method=None, axis=None, inplace=False, limit=None, downcast=None, **kwargs)主要参数:value:需要用什么值去填充缺失值axis:确定填充维度,从行开始或是从列开始method:填充缺失值所用的方法。limit:确定填充的个数,如果limit=2,则只填充两个缺失值。method参数讲解(1)ffill:用缺失值前面原创 2021-08-22 23:14:42 · 13189 阅读 · 1 评论 -
pandas去重
pandas去重df.drop_duplicates(subset = ['AA', 'BB'], keep = "first")表示按照df表 的AA和BB这两列作为唯一进行去重keep 默认为 保存第一个数据 first,可以修改为保存最后一个数据 keep = ‘last’如果将keep= False,意思是不保留任何重复值df.drop_duplicates(subset = ['AA', 'BB'], keep = False)...原创 2021-08-22 22:31:03 · 234 阅读 · 0 评论 -
Pandas 表连接(concat,merge,append)
Pandas 表连接(Merge,join,concatenate)连接对象(Concatenating)pd.concat(objs, axis=0, join='outer', join_axes=None, ignore_index=False,keys=None, levels=None, names=None, verify_integrity=False,copy=True)横向连接In [1]: df1 = pd.DataFrame({'A': ['A0', 'A1', '原创 2021-08-11 07:49:10 · 5073 阅读 · 0 评论 -
数据分析面试
数据分析面试题数据分析师: 发现问题/解决问题数据获取:外部数据的获取——————>爬虫数据清洗:数据空值数据分析(考点最多的部分)可视化(没法考)比excel还简单1.字典是无序还是有序的?python3.6以前 无序的python3.6之后 有序的d{‘a’"1}hash(’a‘)哈希算法 身份号根据这个值 取余在字典中找座位例子:新的版本:字典存储的数据 只放 地址值的数据放在另一个内存上了2. lambda函数的特点lambda x: 1 if x&原创 2021-08-12 18:11:52 · 79 阅读 · 0 评论 -
MySQL导入导出Excel表
导入Excel数据 excel满足条件 1. excel文件要csv格式,其实txt格式也是可以的; 2. 编码为utf-8; (通过记事本修改)步骤: 1.在数据库建表 2.文件格式转化 3.进入该数据库,将excel导入 1 建立的表load data local infile 'excel的路径' into table 数据的表名fields terminated by ',';...原创 2021-08-05 16:12:29 · 397 阅读 · 0 评论 -
Python代码导入出EXCEL数据
1. Pandas 导入 导出 Excel文件Pandas 导入Excelpd.read_excel()主要参数:io、sheetname、header、names、encodingio:excel文件,可以是文件路径、文件网址、file-like对象、xlrd workbook header:指定数据表的表头,参数可以是int、list of ints,即为索引行数为表头 encoding:主要功能是指定用何种编码 names:返回表中指定列名具体参数:panda原创 2021-08-05 15:42:55 · 1641 阅读 · 0 评论