我正在和鲸社区参加“商业分析师 Python 训练营 BA1:应用入门活动” 商业分析师 Python 训练营 BA1:应用入门 - Heywhale.com,以下是我的学习笔记:
学习主题:商业数据分析概论
日期:2023.9.12商业数据分析概论
关键概念/知识点:
- 商业数据分析就是运用科学的方法,从复杂的数据中发现规律,结合实际业务问题找出有价值的信息。
-
3 类主要数据:横截面数据、时间序列数据和面板数据
- 商业数据一般来源于 3 个方面:专业性网站、专业数据公司和信息公司、抽样调查。
- Python :编程界的瑞士军刀 R 语言:统计分析的魔法棒 Stata:通往经济学世界的快速通道MATLAB:数值计算的大师 EViews:时间序列分析的探险家 SAS:商业智能的领航者 SPSS:社会科学领域的数据分析专家
- Python 商业数据分析相关的程序包:Matplotlib、Numpy、SciPy等等
掌握的新函数/方法:
-
df.isna().sum()
- df.loc [df ['A'].isna (),'A'] = B
代码举例:
# 示例代码
import pandas as pd
df = pd.read_csv('/home/mw/input/Titanic.csv')
df.isna().sum()
df.loc [df ['Age'].isna (),'Age'] = 0
关键总结:
- Python 的索引是从 0 开始而非 1,数据切片时要注意选取范围
- python 中可以通过 describe 属性对数据的统计特征进行描述,获取数据集的描述性统计信息
问题/困惑:
- 对于数据可视化分析缺乏更丰富的方式
- 需要更多关于DataFrame索引和切片的练习
下一步计划:
- 了解更多可视化分析的方法
- 练习数据集的统计信息的更多探索分析
- 完成窗口函数的练习
参考资料/相关资源链接:
- Pandas文档:pandas documentation — pandas 2.1.0 documentation
- NumPy教程:NumPy: the absolute basics for beginners — NumPy v1.25 Manual