机器学习（数据集准备）

最新推荐文章于 2024-08-18 09:26:09 发布

慢慢ss

最新推荐文章于 2024-08-18 09:26:09 发布

阅读量1.3k

点赞数

分类专栏：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/adamyouyou/article/details/91375674

版权

机器学习专栏收录该内容

5 篇文章 0 订阅

订阅专栏

一、数据集的划分
机器学习一般的数据集会划分为两个部分：
训练数据：用于训练，构建模型
测试数据：在模型检验时使用，用于评估模型是否有效
划分比例：
训练集：70% 80% 75%
测试集：30% 20% 30%

sklearn.model_selection.train_test_split(arrays, *options)
x 数据集的特征值
y 数据集的标签值
test_size 测试集的大小，一般为float
random_state：是随机数的种子。
随机数种子：其实就是该组随机数的编号，在需要重复试验的时候，保证得到一组一样的随机数。比如你每次都填1，其他参数一样的情况下你得到的随机数组是一样的。但填0或不填，每次都会不一样。
随机数的产生取决于种子，随机数和种子之间的关系遵从以下两个规则：
种子不同，产生不同的随机数；种子相同，即使实例不同也产生相同的随机数。
return ，测试集特征训练集特征值值，训练标签，测试标签(默认随机取)

慢慢ss CSDN认证博客专家 CSDN认证企业博客

码龄14年

31: 原创

10万+: 周排名

212万+: 总排名

3万+: 访问

: 等级

648: 积分

21: 粉丝

18: 获赞

4: 评论

74: 收藏

私信

关注

热门文章

分类专栏

最新评论

图像标注工具labelImg安装方法（win10+Python3.7）
蒙奇D奇哥回复。七十二。: 将resources.py复制到libs文件夹下
图像标注工具labelImg安装方法（win10+Python3.7）
。七十二。: 你好，我按你的显示错误Traceback (most recent call last): File "labelImg.py", line 29, in <module> import resources ModuleNotFoundError: No module named 'resources' ，请问怎么解决
机器学习（xgboost）
慢慢ss: 看报错信息你的python是不是32位的或者是xgboost和python版本不对一个64一个32？
机器学习（xgboost）
silentacit: 您好！我按照您的步骤已经显示成功安装了，但导入的时候报错如下，请问您知道原因么？ C:\Users\silen>python Python 3.7.3 (v3.7.3:ef4ec6ed12, Mar 25 2019, 22:22:05) [MSC v.1916 64 bit (AMD64)] on win32 Type "help", "copyright", "credits" or "license" for more information. >>> import xgboost Traceback (most recent call last): File "<stdin>", line 1, in <module> File "E:\Program Files (x86)\python37\lib\site-packages\xgboost\__init__.py", line 11, in <module> from .core import DMatrix, Booster File "E:\Program Files (x86)\python37\lib\site-packages\xgboost\core.py", line 161, in <module> _LIB = _load_lib() File "E:\Program Files (x86)\python37\lib\site-packages\xgboost\core.py", line 152, in _load_lib 'Error message(s): {}\n'.format(os_error_list)) xgboost.core.XGBoostError: XGBoost Library (xgboost.dll) could not be loaded. Likely causes: * OpenMP runtime is not installed (vcomp140.dll or libgomp-1.dll for Windows, libgomp.so for UNIX-like OSes) * You are running 32-bit Python on a 64-bit OS Error message(s): ['[WinError 126] 找不到指定的模块。']

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。