前言:统计分析,机器学习,建模为什么选择python?
1、python开源免费,有很多现成的计算模型库和包可以用,也有对应的可视化工具,方便绘制图表。
2、python是解释性语言,相对于其他语言,代码实现需要的计算功能要简化很多,省去码代码时间。
3、对于一般的中量级数据,python处理效率还可以,当然比不上java和C++,不过一般可以接受。加上可以嵌入到Java和C++中,效率问题也可以得到解决。
4、Jupyter NoteBook(以前称为IPython NoteBook),它提供了一个用户和IPython内核交互的一个界面,同时它又是一个交互式的笔记本(可以保存你的源代码、运行结果),集文本(markdown)、代码、图像、公式与一体的python的web界面。
一、python的运行环境
集成开发坏境anaconda,可以一键安装,数据分析、机器学习常用的库都存在(比如:numpy、pandas、sckilearn、TensorFlow等),不必自己安装,并且最新的版本自带Jupyter NoteBook。但是新开源的库,包如果需要用到,还是需要自己安装的。
常用pycharm作为代码开发管理的工具。
二、python基本语法
1、不同于其他语言用{}或者标识符end作为区分,python用缩进来管理,如果缩进格式不正确,代码会报错。刚接触时可能觉得不习惯,但是习惯后觉得挺简单方便的,不需要那么多括号,看起来更加简洁。
2、Python 中的变量赋值不需要类型声明。
每个变量在内存中创建,都包括变量的标识,名称和数据这些信息。
每个变量在使用前都必须赋值,变量赋值以后该变量才会被创建。
3、Python的packeg文件夹中用__init__.py作为包的标识,否则不能被正确引用。
4、Python有五个标准的数据类型:
- Numbers(数字):int(有符号整型),long(长整型[也可以代表八进制和十六进制]),float(浮点型),complex(复数)
- String(字符串)
- List(列表)
- Tuple(元组)
- Dict(字典)
简单示例:
#整形
a=1;
#浮点型
b=1.0;
# string,"",'',''' '''
c='hello';
#list
d=[1,3,4]
#tuple,不可修改
e=(1,2);
#dict
f={'key1':'jack','key2':2}
三、数据分析常用的库pandas
使用pandas可以方便进行各种数据统计汇总,查看,画图等操作,几乎可以满足所有需求
http://nbviewer.jupyter.org/github/usemyheart/python-notebook/blob/master/pandas.ipynb