0_入门数据分析

在这里插入图片描述

0. 学习初衷

大学四年咸鱼日常之余,偶然体验过Python和数据分析的小小乐趣。现因为各种求生欲(实习经验,预备读研,职业规划…),开始思考求职意愿,也想好好学习数据分析,作为充实技术栈的开始。

1. “人生苦短,我用Python”

目前主流的编程语言有C/C++、Java、JavaScript、PHP、R、Python等,那么为何选择Python呢?

在这里插入图片描述

因为,太方便了。

Python易于学习,功能强大,足以构建Web应用程序并自动化无聊的东西,另外它提供关于AI、DataScience、机器学习的PyBrain,Numpy、Pandas和PyMySQL等等的库和框架。对于从事数据科学、机器学习等事业的伙伴们,是非常优先的选择。

Python目前有Python2和Python3两个版本,目前Python3已经成为主流,故以Python3为准

2. 安装环境

数据分析,我们需要做什么?运行环境->提取数据->分析数据

因此,安装环境,是入门的首要任务。

2.1 Anaconda
  • Anaconda是包管理器和环境管理器
  1. 附带常用数据科学包:如 conda、Python 和 150 多个科学包及其依赖项。从而可以直接开始处理数据
  2. conda(包管理器):可用来安装和管理这些包
  3. 管理环境:为不同的项目建立不同的运行环境——如Python2和Python3,或为不同版本的包创建环境
  • 下载Anaconda(以Window 64位,Python3为例)

    Anaconda下载文件约 500 MB,官网下载速度会比较慢,容易因网速原因下载失败,可尝试用清华镜像这里是引用

  1. 官网地址:https://www.anaconda.com/distribution/
    在这里插入图片描述

  2. 清华镜像:https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/?C=M&O=D
    在这里插入图片描述

  • 安装Anaconda

    Anaconda占用空间2.6G,建议安装在其他磁盘(若C盘空间充裕,可默认安装路径)
    注意需要添加环境变量(或可在控制面板\系统和安全\系统\高级系统设置\环境变量\用户变量\PATH手动添加两个PATH变量:Anacoda安装路径;Anacoda安装路径\Scripts)

  • 管理包
    有以下两种方式管理包;

  1. Anaconda Navigator-> Environments
    查看 选择Installed 安装/更新 选择环境->输入包的名称->选择包->点击Apply 需要输入conda命令
    选择环境->点击绿色三角箭头->点击 Open Terminal

  2. Anaconda Prompt

    		# 查看当前环境所有安装好的包
    		conda list
    		# conda命令安装numpy包
    		conda install numpy
    		# pip命令安装numoy包
    		pip install numpy
    		# 更新全部包,部分包容易
    		conda upgrade --all
    
2.2 Jupyter Notebook
  • Jupyter Notebook是基于web的交互式计算环境,可以编辑易于人们阅读的文档,用于展示数据分析的过程

  • 启动Jupyter
    打开Anaconda文件夹,点击Jupyter Notebook,启动notebook服务器,浏览器会自动打开,即http://localhost:8888

  • 入门notebook

  1. 顶部三个选项卡:file,running,cluster
    在这里插入图片描述
    Clusters(集群)中创建多个用于并行计算的内核

  2. 创建一个新的notebook
    在这里插入图片描述
    在这里插入图片描述

  3. 常用快捷键
    3.1 关闭Jupyter服务器:命令提示符窗口:ctrl+C两次

    3.2 命令模式(cell侧边为蓝色,或按Esc切换)快捷键
    H:显示快捷键帮助
    F:查找和替换
    P:打开命令面板
    Ctrl-Enter:运行当前cell
    Shift-Enter:运行当前cell并跳转到下一cell
    Alt-Enter:运行当前cell并在下方新建cell
    Y:把当前cell内容转换为代码形式
    M:把当前cell内容转换为markdown形式
    1-6:把当前cell内容设置为标题1~6格式
    Shift+上下键:按住Shift进行上下键操作可复选多个cell
    A:在上方新建cell
    B:在下方新建cell
    X/C/Shift-V/V:剪切/复制/上方粘贴/下方粘贴
    双击D:删除当前cell
    Z:撤销删除
    S:保存notebook
    L:为当前cell的代码添加行编号
    Shift-L:为所有cell的代码添加行编号
    Shift-M:合并所选cell或合并当前cell和下方的cell
    双击I:停止kernel
    双击0:重启kernel

    3.3 编辑模式(cell侧边为绿色,或按Enter切换)快捷键
    Tab:代码补全
    Ctrl-A:全选
    Ctrl-Z:撤销
    Ctrl-Home:将光标移至cell最前端
    Ctrl-End:将光标移至cell末端

  4. 关闭notebook
    在这里插入图片描述

  5. 共享notebook
    在这里插入图片描述

  6. 关闭Jupyter服务器

    请保存所有notebook,再关闭服务器
    再次启动notebook服务器,打开notebook需重新运行所有代码:kernel->Restart & Run All

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值