- 博客(5)
- 资源 (1)
- 收藏
- 关注
原创 model_selection.train_test_split笔记
该数据集共150个样本,三种类别鸢尾花,每种50个样本,4个属性(花萼长度,花萼宽度,花瓣长度,花瓣宽度)test_size:测试集占比(浮点数0~1),也可以是个数(int)后测试集内每个类别分别有20个样本;反之,则每个类别不是按比例分割。random_state:随机种子,设置后每次可得到相同的分割结果。以3:2的比例分割数据集,训练集90个样本,测试集60个样本,设置。stratify:根据类别标签分层分割数据。*arrays:数据(由4个属性构成)
2024-03-01 08:28:16 288 1
原创 数据分析遇到的问题
之前觉得有一点像Meta分析,但后来发现Meta分析除了研究对象的个体差异外其他都是有金标准的,也就是数据的获取手法相对统一,而化学成分作为研究对象不同仪器、提取方案等可能都具有差异,该如何分析就很困扰,希望有大佬能够不吝赐教。一个植物每年都会有不同的实验组用不同的方法测它所包含化合物的含量,如何通过这类文章的对比体现该植物这些年质量的变化呢?
2023-10-30 16:31:15 101 1
原创 KeyError: ‘passes columns are not ALL present dataframe‘
将dataFrame用to_excel写入Excel时如果需要设置变量名,那么dataframe和to_excel的columns属性都需要改,只改其一会报错。
2023-05-07 14:00:30 1938 3
SIMCA中OPLS-DA无法进行置换检验?
2022-12-08
TA创建的收藏夹 TA关注的收藏夹
TA关注的人