baseline
文章平均质量分 79
wherewegogo
这个作者很懒,什么都没留下…
展开
-
MathorCup高校数学建模挑战赛——大数据竞赛 赛道A 移动通信基站流量预测baseline
文章目录前言一、简单分析二、具体程序1.引入库2.读入数据3.数据处理4.模型训练和预测5.结果文件输出总结前言本文给出2020年MathorCup高校数学建模挑战赛——大数据竞赛中的赛道A移动通信基站流量预测的baseline,这个题目的具体描述和数据集请见链接。整个程序是用python写的,步骤包括文件读取、数据处理、特征构造、模型训练和预测、输出文件保存。读者可以在本文的基础上进行模型的提升。一、简单分析本文的训练数据有9G左右的大小,且特征字段是中文的,panda读取的时候需要注意。另外原创 2020-12-27 15:27:48 · 10868 阅读 · 68 评论 -
2020CCFBDCI训练赛之室内用户运动时序数据分类0.95分方案(tsfresh的使用)
室内用户运动时序数据分类赛题介绍数据简介baseline程序tsfresh对时序数据进行特征提取lgb训练和分类模型融合结果按格式写入csv文件提交结果本文在上一篇室内用户时序数据分类的baseline基础上,融合特征提取和树模型对方案进行了提升改进赛题介绍赛题名:室内用户运动时序数据分类赛道:训练赛道背景:随着数据量的不断积累,海量时序信息的处理需求日益凸显。作为时间序列数据分析中的重要任务之一,时间序列分类应用广泛且多样。时间序列分类旨在赋予序列某个离散标记。传统特征提取算法使用时间序列中的统原创 2020-12-07 11:10:40 · 1526 阅读 · 12 评论 -
2020CCFBDCI通用音频分类CNN方案(0.90+方案)
通用音频分类赛题介绍数据简介import的包音频文件读取特征构造CNN多分类提取预测结果并写入csv文件改进方向参考文献博主继续入门了音频分类问题,根据上一个baseline中的改进方向,写了一个基于CNN的baseline,线上分数0.90左右,随便调一下能到0.93赛题介绍赛题名:通用音频分类赛道:训练赛道背景:随着移动终端的广泛应用以及数据量的不断积累,海量多媒体信息的处理需求日益凸显。作为多媒体信息的重要载体,音频信息处理应用广泛且多样,如自动语音识别、音乐风格识别等。有些声音是独特的,可原创 2020-11-30 10:52:01 · 6006 阅读 · 23 评论 -
2020CCFBDCI训练赛之通用音频分类baseline
通用音频分类赛题介绍数据简介import的包音频文件读取特征构造lgb多分类提取预测结果并写入csv文件改进方向参考文献博主是音频分类小白,这两天刚入门,写个baseline记录一下,而且由于时间有限,代码简陋,请各位大神轻喷。赛题介绍赛题名:通用音频分类赛道:训练赛道背景:随着移动终端的广泛应用以及数据量的不断积累,海量多媒体信息的处理需求日益凸显。作为多媒体信息的重要载体,音频信息处理应用广泛且多样,如自动语音识别、音乐风格识别等。有些声音是独特的,可以立即识别,例如婴儿的笑声或吉他的弹拨声。原创 2020-11-20 16:45:44 · 2537 阅读 · 10 评论 -
2020CCFBDCI训练赛之室内用户运动时序数据分类baseline
室内用户时序数据分类赛题介绍数据简介数据分析Baseline程序提交结果赛题介绍赛题名:室内用户运动时序数据分类赛道:训练赛道背景:随着数据量的不断积累,海量时序信息的处理需求日益凸显。作为时间序列数据分析中的重要任务之一,时间序列分类应用广泛且多样。时间序列分类旨在赋予序列某个离散标记。传统特征提取算法使用时间序列中的统计信息作为分类的依据。近年来,基于深度学习的时序分类取得了较大进展。基于端到端的特征提取方式,深度学习可以避免繁琐的人工特征设计。如何对时间序列中进行有效的分类,从繁芜丛杂的数据集原创 2020-11-08 16:01:05 · 3524 阅读 · 13 评论