2020年12月_liying_tt

原创 Day6-Python连接(DataWhale)

连接import numpy as npimport pandas as pd一、关系型连接1. 连接的概念on参数：连接的键值how参数：连接形式：merge、join(left、right、inner、outer)只要两边同时出现的值，就以笛卡尔积的方式加入，如果单边出现则根据连接形式进行处理2. 值连接1.上面是两张表根据某一列的值来连接，事实上还可以通过几列值的组合进行连接，这种基于值的连接在 pandas 中可以由 merge 函数实现df1 = pd.DataFrame

2020-12-29 21:13:51 305

原创 Day6-SQL综合练习(Datawhale)

目录练习1：分组求和练习2：交换位置练习3：分数排名练习4：连续出现的数字练习5：树节点练习6：至少有五名直接下属的经理练习7：分数排名练习8：查询回答率最高的问题练习9：各部门前3高工资的员工练习10：平面上最近距离练习11：行程和用户练习1：分组求和各部门工资最高的员工（难度：中等)1. 创建employee 表，包含所有员工信息，每个员工有其对应的 Id, Salary 和 DepartmentID。 Id .

2020-12-28 02:13:24 616

原创 Day5-Python变形(DataWhale)

变形import numpy as npimport pandas as pd一、长表变宽表长表：一个表中把性别存储在某一个列中,它就是关于性别的长表宽表：把性别作为列名，列中的元素是某一其他的相关特征数值，这个表是关于性别的宽表#长表pd.DataFrame({'Gender':['F','F','M','M'], 'Heigth':[163,160,175,180]}) Gender Heigth

2020-12-27 20:52:57 655

原创 Day4-Python分组(DataWhale)

分组import numpy as npimport pandas as pd一、分组模式及其对象1. 分组的一般模式分组的三个要素：分组依据、数据来源、操作及其返回结果一般模式：df.group(分组依据)[数据来源].使用操作df = pd.read_csv('data/learn_pandas.csv')df.groupby('Gender')['Height'].mean()#按照性别统计身高的平均值GenderFemale 159.19697Male 1

2020-12-25 20:02:38 850

原创 Day5-SQL高级处理(Datawhale)

目录一、窗口函数概念1.1 窗口函数概念及基本的使用方法二、窗口函数类别1. 专用窗口函数2. 聚合函数三、窗口函数计算移动平均值四、GROUPING运算符1. ROLLUP五、练一练练习1练习2练习3总结一、窗口函数概念1.1 窗口函数概念及基本的使用方法窗口函数也称OLAP(OnLine Analytical Processing)函数，对数据库数据进行实时分析处理窗口函数可以有选择的对某一部分数据进行汇总、计算和排序&.

2020-12-24 00:36:19 141

原创 Day3-Python索引(Datawhale)

一、索引器import numpy as npimport pandas as pd1.1 表的索引列索引，通过[列名]实现：返回值为Series[列名组成的列表]：返回值为DataFrame.列名：取出单列并且列名不包含空格,等价于[列名]df = pd.read_csv('data/learn_pandas.csv', usecols=['School','Grade','Name','Gender','Weight','Transfer'])df['N

2020-12-22 23:38:18 458

原创 Day4-SQL集合运算(Datawhale)

目录SQL集合运算一、表的加减法1.1 表的加法-UNION1.1.1 UNION1.1.2 UNION ALL1.1.3 bag模型和set模型1.1.4 隐式类型转换1.2 MySQL不支持交运算INTERSECT1.3 差集，补集与表的减法1.4 对称差1.5 助并集和差集实现交集运算二、连接(JOIN)1. 内连接(INNER JOIN)2. 自连接(SELF JOIN)3. 自然连接(NATURAL JOIN)2.4 外连接(OUTE

2020-12-22 10:42:18 1624 3

原创 Day3-SQL视图、函数(Datawhale)

系列文章目录提示：这里可以添加系列文章的所有文章的目录，目录需要自己手动添加例如：第一章 Python 机器学习入门之pandas的使用提示：写完文章后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录系列文章目录前言一、pandas是什么？二、使用步骤 1.引入库 2.读入数据总结前言提示：这里可以添加本文要记录的大概内容：例如：随着人工智能的不断发展，机器学习这门技术也越来越重要，很多人都开启了学习机器学习，本文就介绍了机器学习..

2020-12-20 21:06:11 276

原创 Day2-Python-Pandas基础(Datawhale)

1. Pandas基础import numpy as npimport pandas as pdprint("pandas的版本是：",pd.__version__)pandas的版本是： 1.1.31.1 文件的读取和保存1.1.1 文件的读取1.1.1.1 读取csv文件pd.read_csv() 将数据放入目录下，会减少不必要的麻烦df_csv = pd.read_csv('data/my_csv.csv',header=None,usecols=[3,4])df_csv

2020-12-19 23:23:53 297 2

原创 Day2-SELECT查询语句(Datawhale)

提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言一、pandas是什么？二、使用步骤 1.引入库 2.读入数据总结前言第二天，来学习简单的SQL查询语句SELECT。提示：以下是本篇文章正文内容一、基础查询二、使用步骤1.引入库代码如下（示例）：import numpy as np import pandas as pd import matplotlib.pyplot as plt impor...

2020-12-17 09:54:30 154

原创 Day1-Python-Numpy(Datawhale)

1. python基础1.1 列表推导式与条件赋值1.1.1 列表推导式L = [] #创建空列表def my_func(x): #定义函数my_func() return 2*xfor i in range(5): #for循环 L.append(my_func(i))print(L)[0, 2, 4, 6, 8]使用列表推导式[function for i in list] function:映射函数,list：迭代的对象[my_func(i) for i

2020-12-16 19:46:35 275 2

原创 Day1-初识SQL(DataWhale)

SQL目录基础SQL的学习，持续更新。Day1 初识SQL一、初识数据库1.DBMS的分类2. RDBMS的常见系统结构二、初识SQL1. SQL语句分类2. SQL基本书写标准3. 命名规则4. 数据类型5. 约束的设置三、SQL语句1. 数据库创建2. 数据库的使用3. 表的创建4. 表的删除5. 表的更新6. 数据的插入7. 数据的删除8. 数据的更新练习题小言Day1 初识SQL一、初识数据库数.

2020-12-15 11:20:47 598

liying_tt的博客