为何学习Python?这是我看到的最好回答

Python已经是现代人不可或缺的工具。如果你熟悉下面的场景,你可以考虑学习Python。学习Python可以更好地解决问题,提升工作效率。

1.1.1 繁忙的工作场景

我们天天都在忙,究竟在忙些什么?

查找各种文件,在一个个文件夹里来回穿梭。

在TXT、XLS/XLSX、DOC/DOCX、PPT、PDF文档之间来回切换,复制、粘贴,运指如飞。

打开几十个网页,以便及时获取信息。

将各种数据输入系统,以及把数据填写到各种Excel表格中。

各种办公系统、ERP软件的日常操作,不停地用鼠标点点点。

这些场景构成了我们的工作日常。当然,有时候我们还会面对各种“变态”的工作任务,例如整理陈年档案,从几千份简历中提取参加应聘人员的信息,向系统输入上千条数据,用网页查询几千个手机号归属地,删除几百个Word文档中的关键词……

说起来,我们真忙,还没练成“无影手”,就已经得了“鼠标手”“键盘手”和颈椎病。据媒体报道,都市白领普遍存在过度劳累现象。问题是,加班加点地“忙”,效率有提升吗?

将我们日常的工作归纳一下,可以分为以下几大类。

1.查找资料

据说,人的一生差不多有三分之一的时间要浪费在找东西上,除了有目的地找东西以外,还有很大一部分时间浪费在找不到的东西上。我们花了大量时间找资料,这里的资料包括本地资料和网络资源。

本地资料是指计算机上的文件。我们在使用计算机时,会花大量的时间找文件。我们每天还消耗了大量时间上网查资料,但是效率也不高,不一定能找到有价值的资料。

如果不花时间认识文件,那么就会花更多时间找文件。什么是文件?文件有哪些类别?文件的结构是怎么样的?不同的文件有什么特征?文件是如何存储的?我们需要抽点时间学习文件管理,同时再认识一下常用的几种文件。

同样,我们天天上网,但是我们真的懂网络吗?例如,网页的结构、网络通信,一个简单的单击背后的数据传输原理等。磨刀不误砍柴工,懂网络以后,我们通过爬虫技术,能够千百倍地提升找资料的效率。有程序24小时为我们“盯”着网站,怎么会错过重要信息呢?小编推荐一个学python的学习老师围鑫(同音),前边一组是:mengy ,后边一组是:7762,把以上两组字母按照先后顺序组合起来即可,她会安排学习的。,无论你是大牛还是小白,是想转行还是想入行都可以来了解一起进步一起学习!裙内有开发工具,很多干货和技术资料分享!

随着互联网的高速发展,数据总量急剧增长。在大数据的时代,我们查找资料的方式也需要转变,对于有些工作,人脑得让位于计算机。例如,我们用搜索引擎搜索资料,可能有用的资料要在搜索结果的十几页、几十页、甚至几百页之后才会出现,如图1-1所示,那么仅靠肉眼一页一页地翻看,恐怕难以达到目的。

为何学习Python?这是我看到的最好回答

图1-1

工作中,我们经常浏览网页和各种论坛。一个网络热帖有时会有几百页,人工看完非常耗时间,如图1-2所示。通过爬虫技术,我们可以一次性获取各个分页的地址,然后在分页的源代码里面提取出文字信息,得到“脱水版干货”,大大节约了时间。

时间是宝贵的,不应该浪费在找资料这种重复而乏味的事情上。

为何学习Python?这是我看到的最好回答

图1-2

2.提取数据

大数据时代,大家都在谈数据分析、数据的可视化呈现和各种炫酷的图表制作技巧。

在现实工作中,数据在哪里呢?数据并不是规整地放在数据库中,事实上,大量的数据封锁在一张张Excel表格里、在Word文档里、在PDF文档里,甚至在扫描的图片里,还有的数据封闭在企业内网的各种专用数据终端里。我们日常要做的工作就是数据提取和清洗,这是很基础但也很重要的工作。

例如,金融行业离不开企业分析,然而企业年报披露材料中有很多是PDF扫描件,其中的文字无法复制,财务表格千差万别,数据难以提取。股权结构、股东结构隐藏在图片中,也难以提取。数据提不出来,自然无法进行统计、汇总和比较。

所以,我们看到在投资银行里,大量的新员工前几年的工作都是“摘数据”,即从各种PDF版本或者纸质文件的企业年报中,手动地把财务数据提取到Excel表格里。

假设我们需要对全国的银行做一个深度分析,那么就需要获取所有银行的信息披露报告。对于非上市银行来说,其信息披露报告散见于各地市级的报纸。我们通过全国报刊数据库可以下载报纸电子版,很多电子版报纸都是PDF格式或者图片格式,如图1-3所示。因此提取和清洗数据问题的难点就在于解析PDF和图片,提取文字和表格中的数字。

为何学习Python?这是我看到的最好回答

图1-3

3.填写表格

工作中我们总是有太多的表要填,这一点相信大家都深有体会。“上面千条线,下面一根针。”工作要留痕,台账少不了,还得有图片。工作做完不算完,还有很多报表要填。每个人身上都背负了几十张报表,如日报、周报、月报、季报等。

实际工作中要填写一堆表格,而很多表格上面的信息都是重复的。一方面,我们期望报表少一点;另一方面,我们也要适应管理部门的要求。管理越来越精细,数据搜集越来越频繁,自然报表就会越来越多。从技术角度来说,填表就是数据的搬运。各个部门都有自己的报表格式和样式,同样的数据要装入不同的报表。这种工作最适合用程序来自动完成。如果将这几十张报表的钩稽关系、交叉引用关系理清楚,则只需要一张基础信息表,其他报表都可以通过引用来自动生成。自动化填表既保证了效率,又确保了数据的一致性,而手动填表误差在所难免,经常出现“数据打架”的问题。

有时还需要把Excel表格中的数据填到各种企业内网系统里,这需要大量的键盘录入工作。我们改变不了

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值