数据挖掘基础知识

本文介绍了数据挖掘的主要模块,包括Numpy, Pandas, Matplotlib, StatsModels, Scipy, Scikit-Learn, Keras 和 Gensim。特别讨论了Pandas中的DataFrame和Series对象,以及一些关键函数如累积计算和滚动计算。在绘图函数部分,讲解了如何使用plot绘制各种图形,如线性图、折线图、饼图和直方图,以及如何添加对数轴和误差条。" 114290994,9100421,Next主题快速配置黑暗模式,"['hexo', 'javascript', '前端开发', '博客美化']
摘要由CSDN通过智能技术生成

主要的数据挖掘模块:

  • Numpy
  • Pandas
  • matplotlib
  • StatsModels
  • Scipy
  • Scikit-Learn
  • Keras
  • Gensim
pandas中的一些函数

DataFrame或者Series的对象

方法名 函数功能
sum() 求和(按列)
mean() 算数平均数
var() 方差
std() 标准差
corr() Spearman(Pearson)相关系数
cov() 协方差矩阵
skew() 偏度(三阶矩)
kurt() 峰度(四阶矩)
describe() 给出样本的基本描述

累积计算(cum): 计算前1,2,3…n的

方法名 函数功能
cumsum 前n的和
cumprod
cummax 最大值
cummin 最小
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值