数据挖掘
only a thought
破山中贼易,破心中贼难
展开
-
综合练习
Pandas缺失值处理 如何进行缺失值处理 删除含有缺失值的样本 替换/插补 如何处理nan 判断数据中存在NaN pd.isnull(df) pd.notnull(df) 删除含有缺失值的样本 df.dropna(inplace=False) 替换/插补 df.fillna(value, inplace= False) 不是缺失值nan,有默认标记的 #判断是否有缺失值 import pandas as pd import numpy as np movie = pd.read_c..原创 2020-10-13 17:42:25 · 103 阅读 · 0 评论 -
Pandas
Pandas 介绍 panel + data + analysis panel面板数据 = 计量经济学 三维数据 以Numpy为基础,值为Numpy模块在计算方面性能高的优势 基于matplotlib,能否简便的画图 独特的数据结构(DataFrame Panel Series) 优势 便捷的数据处理能力 读取文件方便 封装了Matplotlib,Numpy的画图和计算 DataFrame 结构:既有行索引,又有列索引的二维数组 import numpy原创 2020-09-27 20:29:45 · 95 阅读 · 0 评论 -
Numpy
Numpy 高效的运算工具 学习任务:数值运算库 优势 ndarray(n-任意,d-维度,array数组,任意维度数组)属性 描述相同类型的‘item’的集合 基本操作 ndarray,方法() numpy.函数名() ndarray运算 合并,分割,IO操作,数据处理(了解) Numpy介绍 Numpy(Numerical Python)是一个开源的Python科学计算库,用于快速处理任意维度的数组。Numpy支持常见的数组和矩阵操作,对于同样的原创 2020-09-26 20:50:20 · 178 阅读 · 2 评论 -
Matplotlib
库的介绍 matplotlib numpy pandas TA-Lib 技术指标库 tables 数据格式 hdf5 jupyter 数据分析与展示的平台 如果TA-Lib出现问题,去这个网址下载 https://www.lfd.uci.edu/~gohlke/pythonlibs/#ta-lib 其他库找不到可以到这个网址 https://www.lfd.uci.edu/~gohlke/pythonlibs Jupyter Notebook介绍 web版的ipython..原创 2020-09-25 20:36:31 · 219 阅读 · 0 评论