- 博客(4)
- 收藏
- 关注
原创 训练集、测试集、验证集
训练集:确定模型的参数;验证集:确定模型的超参数;(如多项式的次数N)测试集:评估模型的泛化性能,选择最优模型;例子:色泽、根蒂、敲声来确定好瓜还是坏瓜。将数据分成训练集、验证集、测试集1、决策树模型,选定初始预剪枝的参数值,用训练集训练,生成模型;改变预剪枝参数值若干次,用训练集训练,生成若干模型,用验证集检验正确率,确定最优的预剪枝参数值;2、多项式回归,选定多项式次数N,用训练集训...
2019-04-29 12:40:00 4334 1
原创 张量分解的学习和理解
发现很多大佬都用张量分解来做研究,虽然最近事情比较多,但还是作死开始看这块理论了,花了几个晚上刷了一下,有一个大致的了解了。接下来,我主要是整理下网上写的较好的材料(网上对张量分解的资料还是较多的,但是质量及完整度参差不齐),以及提供一个从完全不了解到开始了解这块知识的学习路线(当然还是很浅的,hhh),希望对刚开始接触的同志们能提供一些帮助吧,接下来就开始。step1:初识张量,简单地了解下...
2019-04-26 23:46:37 8522 3
原创 R&SPSS重复测量方差分析
最近在做重复测量方差分析,真的是走了很多弯路,足足花费了我两周的时间,因此在此写一篇博文,希望能给其他人提供一些参考。先说建议:建议使用SPSS,不要使用R,会省很多精力,我用R做了3天,失败了,然后改用SPSS,花了1天就搞定,一方面是因为SPSS确实对用户很友好,而且很简单,另一方面也是因为SPSS有很多的教程,照着用就行了,很方便。接下来,我首先介绍我的项目背景吧,我是获得了某月一个城...
2019-04-20 23:52:08 14738 3
原创 dataframe.to_csv()中文乱码
今天又遇到了dataframe.to_csv()然后文件里的中文乱码了。1、首先吧dataframe.to_csv(“file_name” ,encoding = ‘utf-8’)结果乱码依旧。2、上网查了下,改成了dataframe.to_csv(“file_name” ,encoding = ‘utf_8_sig’)结果乱码依旧3、然后改成了dataframe.to_csv(“fil...
2019-04-02 10:13:41 7749 7
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人