Jupyter notebook如何打开数据集

Jupyter notebook只能打开当前目录下的数据集(txt、CSV等),所以需要把数据集倒导入到当前目录下,导入的方法是

Upload,

但是这样导入文件的大小是由限制的,当数据集太大,该怎么导入呢?

简单粗暴的方法就是直接把数据集拷贝到Jupyter notebook的目录下,如果不知道Jupyter notebook的默认目录怎么办?那就修改它的目录,修改方法见 https://www.zhihu.com/question/31600197?sort=created

然后把数据集拷贝到这个目录下就好了


Jupyter Notebook中导入数据集可以通过以下几种方式实现: 1. 使用pandas库导入数据集:首先,确保你已经安装了pandas库。然后,在Jupyter Notebook中创建一个新的代码单元格,使用以下代码导入数据集: ```python import pandas as pd # 读取CSV文件 data = pd.read_csv('path_to_your_dataset.csv') # 显示数据集的前几行 data.head() ``` 在上述代码中,将`path_to_your_dataset.csv`替换为你数据集的实际路径。这将使用pandas库的`read_csv()`函数读取CSV文件,并将数据存储在名为`data`的DataFrame对象中。你可以使用`head()`函数显示数据集的前几行。 2. 使用numpy库导入数据集:如果你的数据集是以文本文件或其他格式存储的,你可以使用numpy库来导入数据。在Jupyter Notebook中创建一个新的代码单元格,使用以下代码导入数据集: ```python import numpy as np # 从文本文件中加载数据集 data = np.loadtxt('path_to_your_dataset.txt') # 显示数据集的形状 print(data.shape) ``` 在上述代码中将`path_to_your_dataset.txt`替换为你数据集实际路径。这将使用numpy库的`loadtxt()`函数从文本文件中加载数据,并将数据存储在名为`data`的numpy数组中。你可以使用`shape`属性来查看数据集的形状。 3. 使用其他相关库导入数据集:除了pandas和numpy,还有其他一些库可以用于导入数据集,如scikit-learn、tensorflow等。具体的导入方法取决于你使用的数据集和库。你可以查阅相关库的文档或搜索相关教程以获取更多详细信息。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值