pycharm笔记-动手学深度学习(李沐)数据预处理课后习题

1.删除缺失值最多

​
#创建数据集
import os
os.makedirs(os.path.join('.','Data'),exist_ok=True)
data_file=os.path.join('.','Data','house.csv')
#写入数据
with open(data_file,'w') as f:
    f.write('NumRooms,Alley,Price\n')#列名
    f.write('NA,Pave,127500\n')#一行数据
    f.write('2,NA,106000\n')
    f.write('4,NA,178100\n')
    f.write('NA,NA,14000\n')
#读取数据
import pandas as p
data=p.read_csv(data_file)
print(data)
#删除缺失值最多的列(值为NA的为缺失值)
delete=data.drop(colums=data.isnull().sum().idxmax(),axis=1)#axis=1按列删除,axis=0按行删除
print(delete)

​

1、os.makedirs(path,mode=0o777,exist_ok=False):用于递归创建目录,exist_od=True表示若存在目录表示不会报错。

2、os.path.join():用于路径拼接文件路径。

     os.path.join('.','Data','house.csv'):表示当前目录的Data文件夹下的house.csv文件的目录

3、.csv:是一种逗号分隔值格式的文件,用来存储数据的纯文本格式文件。

4、with open(文件名,模式) as 文件对象:

              文件对象.方法()

其中'w'表示打开一个文件只用于写入,如果该文件已存在则将其覆盖。如果该文件不存在,创建新文件。

f.write(str):将字符串写入文件

5、pandas.read_csv():将csv文件转化为DataFrame或者是TextParser。

6、DataFrame.drop(lables=None,axis=0,index=None,colums=None,level=None,inplace=False,erros='raise'):

labels:待删除的行名或列名

axis:删除时所参考的轴

index:待删除的行名

columns:待删除的列名

level:多级列表时使用

inplace:布尔值

7、.isnull().sum():缺失值的数量

8、.idxmax():返回最大值的索引     

2.将预处理后的数据集转换为张量格式

#转换为张量模式
import numpy as np
inputs,outputs=delete.iloc[:,0],delete.iloc[:,1]
inputs=inputs.fillna(np.mean(inputs))
inputs,outputs=torch.tensor(inputs.values),torch.tensor(outputs.values)
print(inputs)
print(outputs)

.fillna():用来填补数据集中缺失值或不完整值的方法

.mean():numpy库中的函数,用来求平均值

torch.tensor(data,dtype=None,device=None,requires_grad=False):是python函数,data可以是list,tuple,NumPy ndarray,scalar和其他类型。

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
使用Anaconda3和PyCharm来配置TensorFlow-GPU 2.4.0深度学习环境是一个相对简单的过程,我将分享我的经验。 首先,你需要确保已经在计算机上安装了Anaconda3和PyCharm。然后,你可以按照以下步骤进行配置: 1. 打开Anaconda Navigator,并创建一个新的虚拟环境。你可以选择Python 3.7版本,并命名环境为"tensorflow-gpu"。 2. 激活新环境后,在终端或命令提示符下输入以下命令来安装TensorFlow-GPU 2.4.0: ``` conda install tensorflow-gpu=2.4.0 ``` 3. 安装完成后,你可以通过以下命令验证TensorFlow-GPU是否正确安装: ``` python -c "import tensorflow as tf; print(tf.__version__)" ``` 如果输出显示为2.4.0,则说明TensorFlow-GPU已经成功安装。 4. 接下来,在PyCharm中打开一个新的项目。在项目设置中,选择已创建的虚拟环境"tensorflow-gpu"作为项目的Python解释器。 5. 在PyCharm的终端中,使用以下命令来安装GPU版本的TensorFlow依赖项: ``` pip install tensorflow-gpu==2.4.0 ``` 6. 安装完成后,你可以编写和运行使用TensorFlow-GPU的代码了。 在配置过程中,可能会遇到一些问题。例如,TensorFlow-GPU要求计算机上安装了适当的显卡驱动程序,并且CUDA和cuDNN版本与TensorFlow-GPU的要求相匹配。此外,如果你在安装过程中遇到任何问题,可以尝试升级或降级Anaconda、PyCharm和TensorFlow-GPU版本,以找到兼容的组合。 总之,通过Anaconda3和PyCharm配置TensorFlow-GPU 2.4.0深度学习环境是一项相对简单的任务。如果按照上述步骤操作,你应该能够成功地设置和使用TensorFlow-GPU来进行深度学习任务。
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值