数据分析学习笔记

数据分析学习笔记-第一记

第一次尝试边学习边写笔记,重新学习数据分析,记录一些自己的小困难解决;

前期准备

新手难免碰到各种有些小尴尬的问题,以下为准备工作的流程和期间遇到的小困难;

  1. 安装python: 主要是要去官网下载python,配置环境(这次没有重新搞,所以就不赘述);
  2. **安装numpy和pandas:**主要在终端输入
pip install numpy

如果显示已存在,需要更新,可以使用代码

python -m pip install -upgrade pip

如果发现经常运行了一些,就失败timedout之类,可以使用清华镜像

pip install -i https://pypi.tuna.tsinghua.edu.cn/simple numpy

如果利用清华镜像更新numpy,可以用

python -m pip install -upgrade pip -i https://pypi.tuna.tsinghua.edu.cn/simple
  1. **安装jupyter:**新手可以安装anaconda,在Home页install jupyter notebook;

以上基本就是准备工作,下面就开始学习;

学习的内容主要包括如下几块

  1. 数据加载,pandas基础,探索性数据分析
  2. 数据清洗及特征处理
  3. 数据重构
  4. 数据可视化
  5. 模型搭建与模型评估

数据加载

载入数据

  1. 导入numpy和pandas
import numpy as np
import pandas as np

这里没有出现问题,如果有问题应该是python环境下安装numpy和pandas 两个库出现了问题;

  1. 载入数据
    有两种方式:使用相对路径和绝对路径进入载入;
df = np.read_csv(‘train.csv’)
or 
df = np.read_csv("/users/iii/train.csv)

这里出现过两个错误:
第一个:invalid syntax; 原因是没有np.read_csv()中的文件名未加引号;
第二个:“train.csv” does not exist; 这个错误主要是没有将数据文件放置到jupyter的运行目录下;所以,我先找到了jupyter的运行目录,使用如下方法:

ipmort os
os.getcwd()

找到目录,然后把数据文件放置这个目录下,然后就成功了;

小结

真的是这些小挫折花费了好久,虽然学的不多,但是后续还是可以继续了;

  • 留两个后续的小尾巴给自己:

  • 如何更改jupyter的运行目录,目前是放在/users下面这样肯定不可以,后续看看修改;

  • 为什么使用pycharm打开的时候加载numpy和pandas就失败了呢?后续还要再配置下;

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值