数据分析(2)
- 以下是工作中遇到问题时,检索到比较好的案例,
收集起来方便自己查看。 - 同时,希望也能给遇到相同问题的同学节约时间,
快速检索到解决方案。
1.pandas多列合并成一列
https://blog.csdn.net/katyusha1/article/details/98501938
2.指定位置添加列
https://www.cnblogs.com/rrttp/p/8108188.html
3. matplotlib 并列条形图
https://www.cnblogs.com/Wendy-r/p/14933291.html
4. 列表list对应项求和
https://blog.csdn.net/sinat_29047129/article/details/103657296
5. 需求描述(直方图)
今天遇到一个问题,就是有一个列表数据,划分一个固定区间,统计每个区间数量。
from itertools import groupby
score_list = [6.3, 1.2, 6.2, 5.6, 9.5, 1.6]
# 步长
step = 1
for k, g in groupby(sorted(score_list), key=lambda x: x//step):
print('{}-{}: {}'.format(k*step, (k+1)*step+1, len(list(g))))
7. pyecharts
因为工作需求,matplotlib样式不能满足需求,所以过渡到了pyecharts。
踩了一些坑,pyecharts检索出来的质量普遍不高,建议直接上官方文档。官方文档还是比较友好的,主要从两个方向入手。
7.1 官方示例
这里包含了常见的图形示例,可以快速上手
https://gallery.pyecharts.org/#/Pie/pie_rosetype
7.2 配置选项
需要调样式的可以研读下全局-系列配置项
https://pyecharts.org/#/zh-cn/html_components
7.3 比较实用的一点,添加自定义文字
https://blog.csdn.net/jerurry/article/details/100653965
8. pandas+docx读取word
奇葩到处有,把表格写进word,还要联合Exel进行数据分析。
8.1 读取word中的表格
首先安装docx,注意有坑,不要只直接 pip install docx
否则导入时会报错
pip install python-docx
8.2 存储到Exel
https://www.jb51.net/article/235588.htm#_label1
https://www.cnpython.com/qa/96564
9. merge 合并表格
https://blog.csdn.net/trayvontang/article/details/103787648
10. 读取nan所在行以, 非nan所在行
pandas返回包含NaN的行
df[df[‘nig_sample_index’].isna()]
pandas返回不包含NaN的行
df[~df[‘nig_sample_index’].isna()]
写在最后
- 学习ing,工作ing,持续更新。。。
- 此页面只做快速导航