Statsmodel,基于Pandas的统计模型库

Statsmodels 是Python的统计建模和计量经济学工具包,包括一些描述统计、统计模型估计和推断。

主页:http://www.statsmodels.org/stable/index.html

源代码:https://github.com/statsmodels/statsmodels

Python分发库:https://pypi.python.org/pypi/statsmodels/

这篇文章是Statsmodels系列文章的第一篇,主要介绍一下 Statsmodels能干什么,以方便一些初学者选择是否需要学习该模块。之后我会发布一些列入门教程,一是作为笔记自己查看,而是作为教程可供学者快 速入门,下面我们来看看Statsmodels有啥特性吧。

  1. Liner regression models:线性回归模型25082020_WH5I.jpg

  2. Gneralized linear models:一般线型模型,主要用于各种设计的方差分析25082020_9vJn.jpg

  3. robust linear models:

    25082020_QL95.jpg

  4. Discrete choice models:离散选择模型,logit模型属于离散选择模型,主要用于微观计量经济学范畴25082020_HqPA.jpg

  5. ANOVA:方差分析模型

    25082020_MIwD.jpg

  6. Time series analysis:时间序列分析25082021_HbLh.jpg

  7. Nonparametric estimators:非参检验25082021_s1bC.jpg

  8. a wide range of statistical tests:各种统计检验25082021_LRl7.jpg

  9. 以各种方式输出表格:text,latex,html;读取各种格式的数据25082021_gZ4E.jpg

  10. 绘图功能25082022_GBrL.jpg

  11. extensive unit tests to ensure correctness of results:大量的整体检验以保证结果的正确性

  12. 活跃的开发团体正在开发大量可用的工具


转载于:https://my.oschina.net/u/2306127/blog/608728

Pandas是一个强大的数据处理库,主要用于数据分析和数据处理。它提供了一个高效的数据结构DataFrame,可以方便地进行数据处理、清洗、转换、合并、分组、统计等操作。 下面是一些基于Pandas库的数据处理技巧: 1. 读取数据:Pandas可以读取多种数据格式,如csv、excel、txt等。读取数据的方法是使用read_csv、read_excel等函数。 2. 数据清洗:数据清洗是数据处理的第一步,可以使用dropna函数删除缺失值、使用fillna函数填充缺失值、使用replace函数替换特定值等。 3. 数据转换:数据转换是将数据从一种形式转换为另一种形式,如转换数据类型、转换日期格式等。可以使用astype函数将数据类型转换为指定类型,使用to_datetime函数将字符串日期转换为日期格式。 4. 数据合并:数据合并是将多个数据集合并为一个数据集的过程,可以使用merge函数、concat函数等。 5. 数据分组:数据分组是将数据按照特定的标准进行分组的过程,可以使用groupby函数进行分组。 6. 数据统计:数据统计是对数据进行统计分析的过程,可以使用describe函数、count函数、mean函数、sum函数等。 7. 数据可视化:数据可视化可以将数据以图形的形式展示出来,可以使用matplotlib库、seaborn库等进行数据可视化。 总之,Pandas是一个非常强大的数据处理库,它提供了丰富的函数和方法,可以轻松处理各种数据处理任务。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值