数据挖掘学习小组第二周之小白python入门
一. 写在前面的话
很开心,坚持到了第二周,第一周复习了统计学的基础原理,第二周的任务就是python、pandas 的基础入门和一些实践了:
对于我这种纯小白来说,任务还是很艰巨的,毕竟一不是专业,二没有基础,更难受的是作业提交也不太好交,总不能把网上看到的大佬的入门教程抄一遍吧?所以这次主要是写写小白我在学习过程中碰到的问题和做的笔记已经一些代码吧
二. 学习笔记
1.在命令行模式下敲命令python,就看到类似如下的一堆文本输出,然后就进入到Python交互模式,它的提示符是>>>;在Python交互模式下输入exit()并回车,就退出了Python交互模式,并回到命令行模式;在命令行模式下,可以执行python进入Python交互式环境,也可以执行python hello.py运行一个.py文件;执行一个.py文件只能在命令行模式执行。
2.这种变量本身类型不固定的语言称之为动态语言,与之对应的是静态语言。静态语言在定义变量时必须指定变量类型,如果赋值的时候类型不匹配,就会报错。
3.If判断语句=要写成==
4.于单个字符的编码,Python提供了ord()函数获取字符的整数表示,chr()函数把编码转换为对应的字符。
5.NumPy(Numerical Python的简称)是Python科学计算的基础包,pandas提供了快速便捷处理结构化数据的⼤量数据结构和函数,pandas兼具NumPy⾼性能的数组计算功能以及电⼦表格和关系型数据库(如SQL)灵活的数据处理功能;
6.SciPy是⼀组专⻔解决科学计算中各种标准问题域的包的集合,主要包括下⾯这些包:
scipy.integrate:数值积分例程和微分⽅程求解器。
scipy.linalg:扩展了由numpy.linalg提供的线性代数例程和矩阵分解功能。
scipy.optimize:函数优化器(最⼩化器)以及根查找算法。
scipy.signal:信号处理⼯具。
scipy.sparse:稀疏矩阵和稀疏线性系统求解器。
scipy.special: SPECFUN(这是⼀个实现了许多常⽤数学函数(如伽玛函数)的Fortran库)的包装器。
scipy.stats:标准连续和离散概率分布(如密度函数、采样器、连续分布函数等)、各种统计检验⽅法,以及更好的描述统计法。
7.在Python中,采用的格式化方式和C语言是一致的,用%实现,你可能猜到了,%运算符就是用来格式化字符串的。在字符串内部,%s表示用字符串替换,%d表示用整数替换,有几个%?占位符,后面就跟几个变量或者值,顺序要对应好。如果只有一个%?,括号可以省略。
8.另一种格式化字符串的方法是使用字符串的format()方法,它会用传入的参数依次替换字符串内的占位符{0}、{1}……,不过这种方式写起来比%要麻烦得多。
9.有些时候,如果代码写得有问题,会让程序陷入“死循环”,也就是永远循环下去。这时可以用Ctrl+C退出程序,或者强制结束Python进程。
10.在Python中,定义一个函数要使用def语句,依次写出函数名、括号、括号中的参数和冒号:,然后,在缩进块中编写函数体,函数的返回值用return语句返回。
11.函数可以同时返回多个值,但其实就是一个tuple。
12.set可以去重,结合正则有奇效。
13.jupter中tab自动补全功能解锁办法(不描述了)
14.jupter字体风格设置
三. 代码实践
时间所限,就大致写了俩,下周争取补上:
1.生成随机数:
2.求平均:
坚持就是胜利!!感觉这周python技术有了很大的提升,虽然还是小白,但是没那么白了,加油!