一、python基础知识总结。
1、安装数据分析环境Anaconda和Jupyter notebook。
目前,Anaconda和Jupyter notebook已经成为数据分析的标准环境。其中,Anaconda是包管理器和环境管理器。Jupyter notebook可以将数据分析的代码、图像以及所有文档统一显示在一个web文档中,结果直观,也很方便。
2、快速学会python的4个关键点。
也可以说是任何编程的四个核心:数据,函数,条件判断,循环。
【关键点1:数据】是编程运行的原材料,python中有5种据类型,用于存放多个数据:
①列表(list)
②元祖(Tuple)
③集合(Sets)
④字典(Dictionary)
4个操作:增加、删除、查询、修改。每个细节都在notebook上逐步操作。
【关键点2:函数】函数是用来实现特定的功能。
特别注意中英文输入法下面的输入。
【关键点3:条件判断】用于处理不确定情形,
始终坚持4个空格的缩进。
【关键点4:循环】:用于批量处理数据。
常用For循环:
continue 用于跳出当前循环,至下个循环。
break用于退出整个循环。
3、什么是模块?(用import导入常用模块和包)
将不同功能的函数,分门别类的放入不同的文件里,这样就能简化很多编程文件。每个模块都有特定的功能。
当我们想使用模块的时候,不需要从零开始写代码,将模块引入我们的程序中,就可以使用这个模块中的功能。
最常用的第三方包:pandas,numpy,matplot
使用第三方包,需要先安装,再使用,(例如,安装pandas,在终端输入:conda install pandas)
4、数据结构。
常用数据结构:
①双向链表queue:队列,栈
入队:queue.append(“006”)
出队:queue.popleft()
入栈:stack.appendleft(‘知乎专栏’)
出栈:stack.pop()
②排序字典:OrderedDict
Python中默认的字典是无序的,比如:
有时候做数据分析,需要对字典里的数据进行迭代,需要按照插入顺序访问key值,这时候,就需要用到,这个collections模块中的排序字典OrderedDict,它是有序的,OrderedDict,不是按照key的大小来排序,而是插入则合格 key值的顺序来排序,
③计数器Counter是一个非常有用的容器,我们可以用计数器来统计电影台词。它返回一个字典对象。实现简要数据统计。
二、学习心得。
01.从去年底,自己对python比较感兴趣,所以,自学了比较多这方面的内容,自己电脑上也早已顺利安装数据分析环境Anaconda和Jupyter notebook。但是还是将猴子老师的课程从头到尾,一字不落的阅读一遍,生怕错过一个细枝末节。也是为后面遇到什么问题,起码知道去哪里寻找答案。
02.接受自己的笨拙,接受学习中途的有些不明白。任何新东西,新技能都是成体系的,那我们在刚开始学的时候,学的细枝末节,总会遇到很多不明白的东西,没关系,记住即可,也不要因此拖延自己的进度,接着往前看,说不定,中间遇到的很多不明白,等你彻底学习完,这些不明白,你都会在后面找到答案。
03.边学习边实践。特别是编程这种技能,学再多理论,不实践,也只是纸上谈兵,不能解决实际问题。
所以,在跟着老师学习过程中,最好是每个知识点都自己在notebook上去跑一遍,为什么和老师同样的代码,结果却不一样,自己去解决问题,寻找原因,做的多了,才能熟能生巧,不断巩固和加深对python的使用。