Python最基础的东西,主要包括以下几个方面:
- 5种数据类型 字符串、数字,布尔,空值,容器
- 条件判断 if else和 if elif else
- 循环 for循环
- 函数 def自定义函数
- 模块和包 import
- 数据结构 队列,栈,排序字典,计数器
学习方法:多用搜索引擎,多敲代码。
理解代码 比记住代码重要。需要的时候进行查找就可以了
ps:写好的代码 可以保存为.MD格式,Markdown,然后在知乎文章列表的右上角三个点...
导入,代码就全部过来了。方法如下图:
一、数据类型
知识点:
##案例1: 变量 数据类型 字符串
二、条件判断
知识点:
#条件判断 值比较 8分以上去看这部电影《摔跤吧,爸爸》
三、循环
知识点:
代码:
#条件判断 值比较 8分以上去看这部电影《摔跤吧,爸爸》
四、函数 def自定义函数
知识点:
代码:
#函数 为了实现某个特点功能 可实现的代码块
五、模块和包 import
知识点:
代码:
#模块
六、数据结构
知识点:
代码:
#数据结构
七、总结
20
学习一维数组 数据分析 分别是numpy和pandas
#一维数据分析
二维数组
# ---------------这里是二维数组分割线---------------------------
购药时间 社保卡号 商品编码 商品名称 销售数量 应收金额 实收金额 0 2018-01-01 星期五 001616528 236701 强力VC银翘片 6 82.8 69.00 1 2018-01-02 星期六 001616528 236701 清热解毒口服液 1 28.0 24.64 2 2018-01-06 星期三 0012602828 236701 感康 2 16.8 15.00
#平均值:是按每列来求平均值,计算的是每一列的数据
商品名称 实收金额 0 强力VC银翘片 69.00 1 清热解毒口服液 24.64 2 感康 15.00
#通过切片功能,获取指定范围的列
社保卡号 商品编码 商品名称 销售数量 应收金额 0 001616528 236701 强力VC银翘片 6 82.8 1 001616528 236701 清热解毒口服液 1 28.0 2 0012602828 236701 感康 2 16.8
#数据框复杂查询:条件判断----------------------
购药时间 社保卡号 商品编码 商品名称 销售数量 应收金额 实收金额 0 2018-01-01 星期五 001616528 236701 强力VC银翘片 6 82.8 69.0 2 2018-01-06 星期三 0012602828 236701 感康 2 16.8 15.0
#查看数据集描述统计信息
购药时间 社保卡号 商品编码 商品名称 销售数量 应收金额 实收金额 0 2018-01-01 星期五 1616528.0 236701.0 强力VC银翘片 6.0 82.8 69.00 1 2018-01-02 星期六 1616528.0 236701.0 清热解毒口服液 1.0 28.0 24.64 2 2018-01-06 星期三 12602828.0 236701.0 感康 2.0 16.8 15.00
salesDf
社保卡号 商品编码 销售数量 应收金额 实收金额 count 6.576000e+03 6.577000e+03 6577.000000 6577.000000 6577.000000 mean 6.091254e+09 1.015869e+06 2.386194 50.473803 46.317510 std 4.889284e+09 5.131153e+05 2.375202 87.595925 80.976702 min 1.616528e+06 2.367010e+05 -10.000000 -374.000000 -374.000000 25% 1.014234e+08 8.614560e+05 1.000000 14.000000 12.320000 50% 1.001650e+10 8.615070e+05 2.000000 28.000000 26.600000 75% 1.004882e+10 8.690690e+05 2.000000 59.600000 53.000000 max 1.283612e+10 2.367012e+06 50.000000 2950.000000 2650.000000
案例分析:医药数据分析
- 理解数据
- 提出问题
- 数据清洗
- 构建模型
- 数据可视化
#实操用excel 进行数据分析
购药时间 社保卡号 商品编码 商品名称 销售数量 应收金额 实收金额 0 2018-01-01 星期五 001616528 236701 强力VC银翘片 6 82.8 69 1 2018-01-02 星期六 001616528 236701 清热解毒口服液 1 28 24.64 2 2018-01-06 星期三 0012602828 236701 感康 2 16.8 15 3 2018-01-11 星期一 0010070343428 236701 三九感冒灵 1 28 28 4 2018-01-15 星期五 00101554328 236701 三九感冒灵 8 224 208
#查看有多少行,多少列
购药时间 社保卡号 商品编码 商品名称 销售数量 0 2018-01-01 星期五 001616528 236701 强力VC银翘片 6 1 2018-01-02 星期六 001616528 236701 清热解毒口服液 1 2 2018-01-06 星期三 0012602828 236701 感康 2 3 2018-01-11 星期一 0010070343428 236701 三九感冒灵 1 4 2018-01-15 星期五 00101554328 236701 三九感冒灵 8
#2)列名重命名
销售时间 社保卡号 商品编码 商品名称 销售数量 应收金额 实收金额 0 2018-01-01 星期五 001616528 236701 强力VC银翘片 6 82.8 69 1 2018-01-02 星期六 001616528 236701 清热解毒口服液 1 28 24.64 2 2018-01-06 星期三 0012602828 236701 感康 2 16.8 15 3 2018-01-11 星期一 0010070343428 236701 三九感冒灵 1 28 28 4 2018-01-15 星期五 00101554328 236701 三九感冒灵 8 224 208
#3)缺失值处理,销售数据和社保卡号不能有缺失值 选择删除确实值-----------
销售时间 社保卡号 商品编码 商品名称 销售数量 应收金额 实收金额 0 2018-01-01 001616528 236701 强力VC银翘片 6.0 82.8 69.00 1 2018-01-02 001616528 236701 清热解毒口服液 1.0 28.0 24.64 2 2018-01-06 0012602828 236701 感康 2.0 16.8 15.00 3 2018-01-11 0010070343428 236701 三九感冒灵 1.0 28.0 28.00 4 2018-01-15 00101554328 236701 三九感冒灵 8.0 224.0 208.00
#字符串转化为日期格式
销售时间 社保卡号 商品编码 商品名称 销售数量 应收金额 实收金额 0 2018-01-01 001616528 236701 强力VC银翘片 6.0 82.8 69.00 1 2018-01-02 001616528 236701 清热解毒口服液 1.0 28.0 24.64 2 2018-01-06 0012602828 236701 感康 2.0 16.8 15.00 3 2018-01-11 0010070343428 236701 三九感冒灵 1.0 28.0 28.00 4 2018-01-15 00101554328 236701 三九感冒灵 8.0 224.0 208.00
salesDf
销售时间 社保卡号 商品编码 商品名称 销售数量 应收金额 实收金额 0 2018-01-01 001616528 236701 强力VC银翘片 6.0 82.8 69.0 3436 2018-01-01 0010616728 865099 硝苯地平片(心痛定) 2.0 3.4 3.0 1190 2018-01-01 0010073966328 861409 非洛地平缓释片(波依定) 5.0 162.5 145.0
# 对行号进行重命名
销售时间 社保卡号 商品编码 商品名称 销售数量 应收金额 实收金额 0 2018-01-01 001616528 236701 强力VC银翘片 6.0 82.8 69.0 1 2018-01-01 0010616728 865099 硝苯地平片(心痛定) 2.0 3.4 3.0 2 2018-01-01 0010073966328 861409 非洛地平缓释片(波依定) 5.0 162.5 145.0 3 2018-01-01 0010073966328 866634 硝苯地平控释片(欣然) 6.0 111.0 92.5 4 2018-01-01 0010014289328 866851 缬沙坦分散片(易达乐) 1.0 26.0 23.0
#6)异常值处理
销售数量 应收金额 实收金额 count 6549.000000 6549.000000 6549.000000 mean 2.384486 50.449076 46.284370 std 2.375227 87.696401 81.058426 min -10.000000 -374.000000 -374.000000 25% 1.000000 14.000000 12.320000 50% 2.000000 28.000000 26.500000 75% 2.000000 59.600000 53.000000 max 50.000000 2950.000000 2650.000000
print
销售时间 社保卡号 商品编码 商品名称 销售数量 应收金额 实收金额 0 2018-01-01 001616528 236701 强力VC银翘片 6.0 82.8 69.0 1 2018-01-01 0012697828 861464 复方利血平片(复方降压片) 4.0 10.0 9.4 2 2018-01-01 0010060654328 861458 复方利血平氨苯蝶啶片(北京降压0号) 1.0 10.3 9.2 3 2018-01-01 0011811728 861456 酒石酸美托洛尔片(倍他乐克) 1.0 7.0 6.3 4 2018-01-01 0013448228 861507 苯磺酸氨氯地平片(安内真) 1.0 9.5 8.5
#第2步:获取时间范围
销售时间 社保卡号 商品编码 商品名称 销售数量 应收金额 实收金额 销售时间 2018-01-01 2018-01-01 001616528 236701 强力VC银翘片 6.0 82.8 69.0 2018-01-01 2018-01-01 0010616728 865099 硝苯地平片(心痛定) 2.0 3.4 3.0 2018-01-01 2018-01-01 0010073966328 861409 非洛地平缓释片(波依定) 5.0 162.5 145.0 2018-01-01 2018-01-01 0010073966328 866634 硝苯地平控释片(欣然) 6.0 111.0 92.5 2018-01-01 2018-01-01 0010014289328 866851 缬沙坦分散片(易达乐) 1.0 26.0 23.0
#第2步:分组
销售数量 应收金额 实收金额 销售时间 1 2527.0 53561.6 49461.19 2 1858.0 42028.8 38790.38 3 2225.0 45318.0 41597.51 4 3005.0 54296.3 48787.84 5 2225.0 51263.4 46925.27 6 2328.0 52300.8 48327.70 7 1483.0 32568.0 30120.22