- 博客(10)
- 收藏
- 关注
原创 python pandas 数据清理常用步骤
存在一些字符串形式的nan 还有一些不规范的“-”需要进行修改,修改成真正的缺失值。并且把age这一列修改成浮点型,方便后续的操作。转换的目的就是为了好分析 把唯一标识转换为字符串 方便匹配 把日期形式的字符串转换为日期形式,方便后续的操作。在这里,可以使用以上两种方法,个人推荐第二种方法,调用pandas时间序列的方法,就可以提取相对应的数据。日期的那一列 只需要年月日,不需要具体到每天的时间。最后重置索引列,因为删除之后,只是把对应的列给删除了,索引并没有修改。首先判断是否有重复行。
2022-12-30 10:11:50 1349
原创 set_index,reset_index与stack,unstack的用法解析
unstack() 不堆叠 默认行的最里层 堆叠到列的最里层。设置值,则设置制定的行堆叠到最里列。stack() 设置堆叠,不设置值默认列的最里层,设置值,则堆叠制定的索引。set_index() 设置索引 制定列来设置。需要传入值,没有默认值。reset_index :清除索引列,默认全部。reset_index 清除索引 默认清除全部索引。set_index:设置索引。unstack:不堆叠行索引。第二种是清除key1的索引。stack:堆叠行索引。
2022-12-29 11:32:15 586
原创 python pandas 练习题一百道-长期更新
将空值用上下值的平均值来填充 针对popularity列。# 提取popularity列大于3且小于7的行。# 对数据按照popluarity进行降序排序。统计grammer列中每种编程语言出现的次数。提取popularity列中的最大值的行。提取popularity列大于3的行。计算popularity列的平均值。# 统计grammer列的字符串长度。将grammer列转换为list。按照grammer列去除重复值。将文件保存在excel文件。# 查看最后5行的数据。# 删除最后一行的数据。
2022-12-28 11:58:32 569
原创 数据库作业-一个简单的火车购买系统库
设计一个火车订票系统数据库,记录乘客的购票情况,其中乘客有Cid,Cname,Tel,各属性分别表示客户身份证号,客户姓名,客户电话;火车班次有Tno,Start,End,各属性分别表示火车班次号,始发地,目的地;乘客在购买车票的时候要记录价格,时间,座位等级信息。•根据以上信息完成数据库的设计(要求CDM、PDM、sql代码、数据库生成结果截图)首先使用powerdesigner生成cdm图使用cdm生成pdm图需要在购买那个关系增加一些属性连接数据库 生成sql代码.
2022-04-26 15:38:24 2470
原创 数据库作业-sql建表和插入数据
create table supplier( supplierno char(6) primary key, suppliername nvarchar(10), address nvarchar(20), number char(11) )create table category( categoryno char(5) primary key, categoryname varchar(20), descriptions text...
2022-04-09 18:58:56 2293
原创 数据库作业-sql语句查询
--1. 查询全部商品信息。select * from Goods;--2.查询类别为“cn002”的所有商品信息。select * from Category join Goods on Category.CategoryNO=Goods.CategoryNOwhere Category.CategoryNO='cn002';--3 查询类别为“cn001”和“cn002”对应的所有商品信息。select * from Category join Goods on Category....
2022-04-09 18:11:14 21284 6
原创 数据库学习_数据库系统概述_04
关系的完整性关系模型的完整性规则是对关系模型的某种约束。主要有实体完整性、参照完整性、用户定义的完整性。一:实体完整性定义:若属性A 是基本关系R的主属性,则A不能取空值。关系模型必须遵守实体完整性规则的原因:实体完整性规则是针对基本关系而言的。一个基本表通常对应现实世界的一个实体集或多对多联系。• 现实世界中的实体和实体间的联系都是可区分的,即它们具有某种唯一性标识。注意①空值就是 “ 不知道 ” 或 “ 不存在 ” 或 “ 无意义 ” 的值。②关系模型中以主码作为唯一性标识
2022-03-19 16:26:05 855
原创 数据库学习_数据库系统概述_03
一:概念明确1 域:是一组具有相同数据类型的值的集合。学历: 学历:{小学,初中,高中,中专,大专,本科, 小学,初中,高中,中专,大专,本科,硕士,博士 硕士,博士}; ;年龄:大于 年龄:大于0 小于150的整数。2 笛卡尔积:给定一组域 给定一组域D 1 , ,D 2 , ,… ,D n ,这些域可以 是 相同的,也可完全不同,则 不同,则D 1 , ,D 2 , ,… ,D n 的笛卡尔积为:D 1 × ×D 2 × ×… ×D n = ={(d 1 , ,d 2 , ,… ,d
2022-03-10 15:29:43 1532
原创 数据库学习_数据库系统概述_02
数据模型的组成要素1_2_1(1)数据结构是主要描述数据类型、内容、性质的有关情况以及描述数据间的联系 ,对系统静态特征的描述。(2)数据操作主要描述在相应数据结构上的操作类型与操作方式 。•是对系统动态行为的描述。• 数据操作的类型 检索、更新(包括插入、删除、修改)。(3)完整性约束条件主要描述数据结构内数据间的语法、语义联系,它们间的制约与依存关系,以及数据动态变化的规则以此来保证数据的正确、有效与相容。商品编号作为码必须非空且取值唯一 (通用)学生性别的取值只能是 学生性别的取值只
2022-03-06 16:57:31 563
原创 数据库学习_数据库系统概述_01
数据库的的应用举例1_11:超市管理系统 2:学校学生管理系统 3:银行业务系统 数据库在生活中用处的重要性。(可能跟会有一些抽象)数据库系统的基本概念1_21:数据(data)是数据库中存储的基本对象,可以定义为;描述实物的符号记录。(可以是数字、文字、图像、声音等。可以经过数字化的处理存入计算机)2:数据库(DataBase,DB)是长期存储在计算机内的有组织的、可共享的大量数据集合。简单来说就是存放数据的地方3:数据库管理系统(DataBase Management System,
2022-03-06 15:39:56 903
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人