数据科学项目实战学习
文章平均质量分 55
输入!输入!输入!一周1~2个项目精读。
小王做笔记
这个作者很懒,什么都没留下…
展开
-
docker常用命令:docker制作镜像过程中常用的命令
docker常用指令原创 2022-08-17 21:37:52 · 2629 阅读 · 0 评论 -
docker镜像制作:制作带有输入参数的docker镜像
docker深度学习镜像制作原创 2022-08-17 17:33:25 · 722 阅读 · 0 评论 -
kaggle download api 下载数据集
kaggle download api 下载数据集 步骤步骤安装 kagglepip install kaggle 找到 kaggle 上的账户,点击头像,找到 account ,找到 API 选项点击 Create New API Token ,生成了 kaggle.json 文件将 kaggle.json 文件放入到 .kaggle 文件夹中;注意,.kaggle 文件夹可以通过 everything工具直接搜索出来得到在命令行直接使用 kaggle downloa原创 2022-05-23 17:38:12 · 618 阅读 · 0 评论 -
keras报错: ValueError: Shapes (None, 1) and (None, 2) are incompatible
keras报错:ValueError:Shapes (None, 1)and (None,2)are incompatible 任务背景错误提示问题解决具体程序任务背景使用 MLP 做时间序列的二分类问题,通过历史股价判断 未来天数 是涨还是跌。错误提示ValueError: Shapes (None, 1) and (None, 2) are incompatible问题解决将标签的数值 0,1 转化成 类别的 0,1from tensorflow.keras.utils import to原创 2021-09-14 10:31:19 · 15361 阅读 · 13 评论 -
还原填充错误的缺失数据
处理填充错误的缺失数据手动方法 map() 函数映射自动方法 for循环 + replace() 替换说明手动方法 map() 函数映射map(func)import pandas as pdimport numpy as np## -------df = pd.DataFrame()df['身高'] = [170, -1, 190, 150, 166]df['体重'] = [50, 65, 70, 60, -1]df.index = ['a', 'b', 'c', 'd', 'e']原创 2021-05-19 09:22:59 · 6991 阅读 · 0 评论 -
新能源汽车大数据学习篇 ----- 定类变量数值化方法(字典化编码 == 标签编码)
将定类变量数值化(编码)#定义函数,将行驶模式(纯电、混动、燃油),档位(自动、倒档、驻车挡)、以及混动车的引擎启动状态信息转换为OneHot信息(定义分类变量)def one_hot(df): r = pd.DataFrame(index=df.index) # 行驶模式(纯电、混动、燃油) one_hot_runmodel = {1:'runmodel_elec',2:'runmodel_hybrid',3:'runmodel_fuel'} for i in one_原创 2021-04-03 10:35:40 · 491 阅读 · 0 评论 -
初心:从输入中积累,从输出中迸发
弯路漫漫真是一言难尽呀!学习数据挖掘一来,起初是跟着网上的课程学习,发现也就这个样呀。跟着课程敲代码,理解了就觉得自己会了,结果发现把自己毁了,拿到项目直接懵逼。后来呢?从书上开始学习,感觉数学公式有什么好推的,直接过一遍就行啦,有什么不懂的直接调用库不就行啦,结果我人傻了,库中的参数这么多,毫无目的的瞎几b调,直接碰运气,凉凉。发现自己之前看到数,建立流水线,特征的处理,只能做一些的处理,真到了解决的时候,直接懵逼。因此:请避免这些弯路!初心写这个专栏,记录自己的对于数学、算法、特征工程、机器原创 2021-04-03 09:56:25 · 135 阅读 · 0 评论