0. 学习初衷
大学四年咸鱼日常之余,偶然体验过Python和数据分析的小小乐趣。现因为各种求生欲(实习经验,预备读研,职业规划…),开始思考求职意愿,也想好好学习数据分析,作为充实技术栈的开始。
1. “人生苦短,我用Python”
目前主流的编程语言有C/C++、Java、JavaScript、PHP、R、Python等,那么为何选择Python呢?
因为,太方便了。
Python易于学习,功能强大,足以构建Web应用程序并自动化无聊的东西,另外它提供关于AI、DataScience、机器学习的PyBrain,Numpy、Pandas和PyMySQL等等的库和框架。对于从事数据科学、机器学习等事业的伙伴们,是非常优先的选择。
Python目前有Python2和Python3两个版本,目前Python3已经成为主流,故以Python3为准。
2. 安装环境
数据分析,我们需要做什么?运行环境->提取数据->分析数据
因此,安装环境,是入门的首要任务。
2.1 Anaconda
- Anaconda是包管理器和环境管理器
- 附带常用数据科学包:如 conda、Python 和 150 多个科学包及其依赖项。从而可以直接开始处理数据
- conda(包管理器):可用来安装和管理这些包
- 管理环境:为不同的项目建立不同的运行环境——如Python2和Python3,或为不同版本的包创建环境
-
下载Anaconda(以Window 64位,Python3为例)
Anaconda下载文件约 500 MB,官网下载速度会比较慢,容易因网速原因下载失败,可尝试用清华镜像这里是引用
-
安装Anaconda
Anaconda占用空间2.6G,建议安装在其他磁盘(若C盘空间充裕,可默认安装路径)
注意需要添加环境变量(或可在控制面板\系统和安全\系统\高级系统设置\环境变量\用户变量\PATH手动添加两个PATH变量:Anacoda安装路径;Anacoda安装路径\Scripts) -
管理包
有以下两种方式管理包;
-
Anaconda Navigator-> Environments
查看 选择Installed 安装/更新 选择环境->输入包的名称->选择包->点击Apply 需要输入conda命令
选择环境->点击绿色三角箭头->点击 Open Terminal -
Anaconda Prompt
# 查看当前环境所有安装好的包 conda list # conda命令安装numpy包 conda install numpy # pip命令安装numoy包 pip install numpy # 更新全部包,部分包容易 conda upgrade --all
2.2 Jupyter Notebook
-
Jupyter Notebook是基于web的交互式计算环境,可以编辑易于人们阅读的文档,用于展示数据分析的过程
-
启动Jupyter
打开Anaconda文件夹,点击Jupyter Notebook,启动notebook服务器,浏览器会自动打开,即http://localhost:8888 -
入门notebook
-
顶部三个选项卡:file,running,cluster
Clusters(集群)中创建多个用于并行计算的内核 -
创建一个新的notebook
-
常用快捷键
3.1 关闭Jupyter服务器:命令提示符窗口:ctrl+C两次3.2 命令模式(cell侧边为蓝色,或按Esc切换)快捷键
H:显示快捷键帮助
F:查找和替换
P:打开命令面板
Ctrl-Enter:运行当前cell
Shift-Enter:运行当前cell并跳转到下一cell
Alt-Enter:运行当前cell并在下方新建cell
Y:把当前cell内容转换为代码形式
M:把当前cell内容转换为markdown形式
1-6:把当前cell内容设置为标题1~6格式
Shift+上下键:按住Shift进行上下键操作可复选多个cell
A:在上方新建cell
B:在下方新建cell
X/C/Shift-V/V:剪切/复制/上方粘贴/下方粘贴
双击D:删除当前cell
Z:撤销删除
S:保存notebook
L:为当前cell的代码添加行编号
Shift-L:为所有cell的代码添加行编号
Shift-M:合并所选cell或合并当前cell和下方的cell
双击I:停止kernel
双击0:重启kernel3.3 编辑模式(cell侧边为绿色,或按Enter切换)快捷键
Tab:代码补全
Ctrl-A:全选
Ctrl-Z:撤销
Ctrl-Home:将光标移至cell最前端
Ctrl-End:将光标移至cell末端 -
关闭notebook
-
共享notebook
-
关闭Jupyter服务器
请保存所有notebook,再关闭服务器
再次启动notebook服务器,打开notebook需重新运行所有代码:kernel->Restart & Run All