python 方向盘_码农:科目二(可以摸方向盘了)

考完科目一,了解了简单规则,我们就可以着手做一些简单数据处理了。

建议各位新手要按耐住初摸方向盘的激动,油门和刹车要分清楚。

【绕车一周,观察车况】这里还是用了猴子老师画的场地指引,我们来试一试。

【上车,发动车辆】第一步,先不要着急上车,先观察车况,看看车身周围有什么状况,反光镜是否正常。在这里我们要先加载pandas。

现在可以上车了——加载Excel。在这里猴子老师原来的加载方法在python新版本中不好用了,要换成课程包里示范的版本。成功启动车之后,不要着急挪车,要看看反光镜和周围情况,按一下喇叭检查下是否正常——salesDf.head() 我们看看我们导入的Excel里有什么,只需要看个样子,所以加了段head()

再看看这字段的类型,因为之后肯定会涉及到字段里的值更改数据类型。就好像吃饭,你总有主食、荤菜(硬菜)、素菜和下酒菜,数据里也会有日期、数字、文字、是非(真假)等不同类型的信息。

【调节座椅,起步前要记得】起步,慢着,是不是漏了什么?是的!你还没调节座椅(更改列的名字,你或者报告使用者会对某些数据有习惯的或熟悉的列名称),这是很严重的事情!你要把座椅调整到适合你身体的情况,这样不只是踩刹车不会累,最主要是帮助在车里的你根据身体位置和场地上暗号的位置来判断车身的位置(我是不会告诉你,在科目二最容易被关掉的X车环节,这个暗暗的记号有多重要)!

【坡起】如果是C1(手动挡)考试,刹车和离合器控制的不好会让车子熄火(考试立即结束),这个时候要赶紧发动车子,虽然是电子化考试,你可以拼一下手速,争取不让电子系统记录到这次熄火——剔除无效的空值数据。

除了删除空值,还有删除一些逻辑上有问题的数值,有可能是系统数据传输的不完整或者记录数据的设备的时钟有问题,更有可能是有些数据被未知的原因改动了。

【S弯路】如果我想只保留数据的某一部分进行处理可以吗?答案是肯定的!比如我们处理考勤打卡记录的时候,上班卡信息可能是:2020-11-11 08:31:03,我们判断ta当天是否迟到(考勤时间不晚于09:00:00),那么这个上班卡里面的日期(2020-11-11)部分是要舍去的。我们先看一下split功能。

好了,就可以上手了。

开车的时候记得按照规定的行车路线和场地的标志,我就方向盘打乱了(上文的date到了下文变data,使得函数结果报错,求助大神之后发现是如此低级的错误),就出糗了。

【侧方停车】取完的列还是object类型,这里要调整成时间类型,这样方便以后统计某一个时间点之前、之后或者两个时间点中间的数据。

【挂一次后的第二次chance】考试如果有一项挂掉(大概率是倒车入库),是从接着的下一个科目作为第一考试项目,这就要对刚刚整理好的数据重新排序。

【查成绩】一次通过上午的考试结束了,你想看看自己的成绩排在第几?虽然只可能有80、90和100三种成绩,那我们来看一下:

销售数量负值?是不是错了?不着急下判断,如果数据本身没有错,那么有可能是退货。作为数据分析人员(司机),对业务和数据(车)还是有一定的了解和实际操作能力,能自己处理加玻璃水、换电瓶、换灯泡及一些简易耗材。

【甩尾】都顺利考过了,是不是可以练甩尾了,简易找一个稍微平坦一些的地方,不然容易把自己颠醒。

数据洗完了,接下来才是正事——构建模型!医院分析消费的情况肯定不是为了能增加盈利,而是要看有什么异常情况。是否有某种药品(背后是相关疾病的发病率)的销售明显高于往常,综合流行病学考虑;

是否有人集中购买超过正常量的药品,会不会是药贩子等。

这些给了一个相对的基准线,就好像我们的行车线,禁不住老调重谈——道路千万条,安全第一条,行车不规范,亲人两行泪”。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值