数据分析学习
Raymone_
这个作者很懒,什么都没留下…
展开
-
SQL 面试题练习
用一条SQL 语句 查询出每门课都大于80 分的学生姓名nameclassscore张三语文81张三数学75李四语文76李四数学90王五语文81王五数学100王五英语90答案 1:使用子查询,先选择分数小于等于 80 分的学生姓名,只要姓名不在这里面的,就每门课程都大于 80 分SELECT D...原创 2019-10-25 15:50:12 · 460 阅读 · 0 评论 -
SQL 学习
SQL 学习原创 2019-10-20 22:07:35 · 650 阅读 · 0 评论 -
统计学:探索性数据分析
面向数据科学家的实用统计学第一章原创 2019-10-09 15:24:23 · 1563 阅读 · 0 评论 -
高阶 Pandas
Pandas 的高阶用法,主要包含分类对象 Categorical,groupby 的“展开” 方法 transform ,分组时间重采样用到的 TimeGrouper 对象原创 2019-08-13 11:01:20 · 597 阅读 · 0 评论 -
Python 数据分析:时间序列
时间序列数据在很多领域都是重要的结构化数据形式。在多个时间点观测或测量的数据形成了时间序列。本文主要学习如下三种标记和引用时间序列数据的方法:- 时间戳:即具体的时刻- 固定的时间区间:如 2018 年的 2 月或整个 2018 年- 时间间隔:由开始和结束的时间戳表示。时间区间可以视为时间间隔的特殊情况原创 2019-08-12 16:09:43 · 988 阅读 · 0 评论 -
数据聚合和分组操作
对数据集进行分类,并在每一组上应用一个聚合函数或转换函数1. 使用一个或多个键(以函数、数组或 DataFrame 列名的形式)将 pandas 对象拆分为多块2. 计算组汇总统计信息,如计数、平均值或标准偏差或用户定义的函数3. 应用组内变换或其他操作,如标准化、线性回归、排位或子集选择4. 计算数据透视表和交叉表5. 执行分位数分析和其他统计组分析原创 2019-08-09 18:13:47 · 4725 阅读 · 0 评论 -
数据清洗与准备
数据清洗与准备1. 处理缺失值1.1 过滤缺失值——dropna1.2 补全缺失值——fillna2. 数据转换2.1 删除重复值2.2 使用函数或者映射进行数据转换——map2.3 替代值——replace2.4 重命名索引2.5 离散化和分箱——cut & qcut1. 处理缺失值缺失值:np.nan;None;1.1 过滤缺失值——dropnaSeries 对象:fro...原创 2019-07-22 22:16:03 · 289 阅读 · 0 评论 -
绘图与可视化
信息可视化,即绘图,主要学习 matplotlib 及以其为基础的库原创 2019-07-25 19:29:56 · 261 阅读 · 0 评论 -
数据规整:连接、联合与重塑
主要包含 pandas 中的分层索引概念,以及特定的数据操作1. 分层索引1.1 分层索引简单介绍1.2 重排序和层级排序1.3 按层级进行汇总统计1.4 使用 DataFrame 的列进行索引2. 联合与合并数据集2.1 数据库风格的 DataFrame 连接——merge2.2 根据索引合并2.3 沿轴向连接8.2.4 联合重叠数据8.3 重塑和透视8.3.1 使用多层索引进行重塑8.3.2 ...原创 2019-07-24 15:50:05 · 367 阅读 · 0 评论 -
pandas 数据载入、存储及文件格式
数据载入、存储及文件格式1. 文本格式数据的读写1. 文本格式数据的读写将表格型数据读取为 DataFrame 的 pandas 解析函数:函数描述read_csv从文件、URL或文件型对象读取分隔好的数据,逗号是默认分隔符read_table从文件、URL或文件型对象读取分隔好的数据,制表符(’\t’)是默认分隔符read_fwf从特定宽度格式的文件中...原创 2019-07-15 22:32:32 · 1139 阅读 · 0 评论 -
pandas入门
pandas 入门1. pandas 数据结构介绍1.1 Series1.2 DataFrame1.3 索引对象2. 基本功能2.1 重建索引: reindex2.2 轴向上删除条目: drop2.3 索引、选择与过滤2.4 整数索引2.5 算术和数据对齐2.6 函数应用和映射2.7 排序和排名2.8 含有重复标签的轴索引3. 描述性统计的概述与计算3.1 相关性和协方差3.2 唯一值、计数和成员...原创 2019-07-13 23:00:41 · 192 阅读 · 0 评论 -
Python 数据分析基础知识部分
Python 数据分析基础知识部分1. Python语言基础、IPython 及 Jupyter notebook1.1 Jupyter notebook1.2 Python 语言基础1.2.1 语言语义1.2.2 标量类型1.2.3 控制流2. 内建数据结构、函数及文件2.1 数据结构和序列2.1.1 元组2.1.2 列表2.1.3 内建序列函数2.1.4 字典2.1.5 集合2.1.6 列表、...原创 2019-06-26 23:27:54 · 382 阅读 · 0 评论 -
NumPy基础
NumPy 基础主要内容:主要内容:ndarray:一种高效多维数组,具有基于数组的便捷算术操作以及灵活的广播功能;对所有数据进行快速的矩阵运算,无序编写循环程序;对硬盘中的数组数据进行读写的工具,并对内存映射文件进行操作;线性代数、随机数生成以及傅里叶变换功能;用于连接 NumPy 到 C、C++ 和 FORTRAN 语言类库的 C 语言 API;...原创 2019-07-07 22:20:43 · 248 阅读 · 0 评论