初入大二对数据分析初入门的感想

大二学期开始了,嗯,是个该好好学习的开始了。原本暑假的任务没有完成,接下来要好好补补了。Python爬虫,一听到这个,我总在纠结Python的语法,总想先把语法学得很好,但是语法这东西是有点抽象,因此一直停滞不前。在开学后的一天。突然发通知要对爬虫这一技术进行考核,于是我也就撇开了语法,直接找到python爬虫的教程,然后用了2个小时,竟然就可以写出一个简单的爬虫。(当然,正则表达式也学了一些基本的)下面是我第一次爬虫的代码示例

import urllib.request
import re
data=urllib.request.urlopen(https://read.douban.com/provider/all).read().decode("utf-8")
pat='<div class="name">(.*?)</div>'
rst=re.compile(pat).findall(data)
print(rst)

在这之后,又对代码完善了一下,将他写入到文件里

import urllib.request
import re
data=urllib.request.urlopen("https://read.douban.com/provider/all").read().decode("utf-8")
pat='<div class="name">(.*?)</div>'
rst=re.compile(pat).findall(data)
fh=open("F:\\python爬虫学习\\02.txt","w")
for i in range(0,len(rst)):
    print(rst[i])
    fh.write(rst[i]+"\n")
fh.close()

经过这次,我对自己的方法有了很大的改变,语法固然很重要,但是一味追求语法却会失去乐趣,因此,实践到基础未免不行,有了熟练的应用,语法更是水到渠成的事。虽然不知道自己想的对不对,但是能走则走,出道山头必有路。

Python爬虫是对数据的抓取,只是数据分析中的一环,有了数据,更要会整理,分析。因此我对Excel的基础操作与函数进行了学习,基础操作不是很难,但是函数实在是太多,我也调整了心态,并没有过多的去追求全部搞会,先大概了解有哪些类型的函数,然后在实践中用到在学未尝不是一种好方法。当然,这些的乐趣实在不是很多,因此我直接拿出泰迪杯的题,看完就懵了,实在是看不懂,但是也没关系,这要是一下子看懂了,那奖金不就是闹着玩的。然后我在CSDN上找到关于这道题的解析,很详细,但说实话,代码什么的还是看不懂,但知道了如何去处理这道题,于是跟着博主的思路,我开始了对这道题的取经之路,首先,去学习了如何用python去实现对EXCEL表格的合并,提取数据,在整合完数据后,就是对数据里的变量进行利用,然后就没了,完全看不懂了。第一,从来没有遇到过这种题,一点经验也没,第二就是学的东西太少了,于是向无头苍蝇似的根本不知道该用什么,于是接下来我就对博主的代码里用到的库进行学习,模仿博主的代码,虽然进步缓慢,但是总要有收获。现在虽然还没有把这道题拿下,但是接下来的速度会越来越快,再次寻找方法,事半功倍。
经过对EXCEL表格的学习,也使我有一种想要把自己的学习任务好好规划的欲望,于是我就根据模板做出了下面的EXCEL规划表
]

以上就是开学到现在的一点收获,以及对自己做的一点改变。

  • 4
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值