自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(10)
  • 收藏
  • 关注

原创 1013 数素数 (20分)

1013 数素数 (20 分)令 P​i表示第 i 个素数。现任给两个正整数 M≤N≤10^4​​ ,请输出 P​M到 P​N的所有素数。输入格式:输入在一行中给出 M 和 N,其间以空格分隔。输出格式:输出从 PM到 P​N的所有素数,每 10 个数字占 1 行,其间以空格分隔,但行末不得有多余空格。输入样例:5 27输出样例:11 13 17 19 23 29 31 37 41 4347 53 59 61 67 71 73 79 83 8997 101 103在这里我觉得根本用不

2020-12-18 13:52:20 58

原创 数据挖掘第九周周报

数据挖掘第九周周报1、本周工作主要是进行在数据集的基础上进行模型融合与参数设置,经过处理以后得到了base_info.csv和entprise_info.csv的merge数据集,2、首先我先按照了训练赛的模型去训练我的数据集,但是效果不是很明显,可能是参数的问题,于是我放弃使用了学习赛的模型,转而百度了LGBM模型单独进行训练,然后是试着手动调节参数,根据手动调节的参数进行提交结果,虽然在自己本地有0.8443的结果,但是线上只有0.76:3、对于线上线下差别这么大,我感觉应该是过拟合了,.

2020-11-23 12:43:44 204

原创 *数据挖掘第八周周报*www

数据挖掘第八周周报1、本周工作主要是进行新的比赛,首先做的是对数据集的分析。刚开始看到数据集不只是一个表格感到有点麻烦,但是看到几个数据集之中的数据之后,我还是只是选择一个base.csv文件进行训练,对于base集,数据集1:base_info.csv包含数据集7和8中涉及到的所有企业的基本信息,每一行代表一个企业的基本数据,每一行有33列,其中id列为企业唯一标识,列之间采用“,”分隔符分割。数据格式如下:[id:企业唯一标识, oplocdistrict:行政区划代码, industr.

2020-11-17 20:35:30 431

原创 **数据挖掘第七周周报*

数据挖掘第七周周报1、本周工作 主要是和大家讨论交流以后,花时间去了解了baseline的方法和实现。看到lgboost和xgb和cat等方法,同时也了解了baseline的方法和特征工程和数据预处理以及模型调参2、baseline的代码风格很好,把几个模型都集中在了一个函数里面,其中的库调用也让我受益很多。def lgb_model(x_train, y_train, x_test): lgb_train, lgb_test = cv_model(lgb, x_train, y_tr.

2020-11-09 19:36:46 161

原创 数据挖掘第六周周报

数据挖掘第流周周报1、本周工作本周主要是添加了PLA线性感知算法python版本,打算与神经网络、,KNN一起对数据处理,对测试集进行了分类,但是由于在PLA分类中,对于数据量太大的情况,对于PLA的权值更新有很大的阻碍,迟迟没办法收敛,我现控制一下权值迭代的次数,但是多次下来发现耗时太大,效果也不好,所以暂时没有用PLA作为分类。 W=np.ones(cols)#initial all weight with 1 count=0 while True: count.

2020-11-02 10:29:40 168

原创 *数据挖掘第五周周报**

数据挖掘第五周周报1、本周工作本周主要是添加了knn算法python版本,与神经网络一起对数据处理,对测试集进行了分类,并得到了结果。如图所示:得到了比上周稍微好一点的结果,说明knn+神经网络的作用还是有的,但是在自己挑选出来的验证集上的结果比这个rank上的结果要好很多就让人捉急了。。。2、本周上课学到的降维方法暂时还没有怎么用,主要是还在尝试不同的K和不同的迭代次数,然后看看要不要在加上几个弱分类器。3、最后遇到的问题就是验证集上的结果与实际rank差距有点大,自己应该好好挑.

2020-10-26 09:29:45 103

原创 数据挖掘第四周周报

数据挖掘第四周周报1、本周工作本周主要是实现了神经神经网络在数据集上的初步运用,在经过主观降维的数据集处理以后,对测试集进行了分类,并得到了结果。如图所示:得到了不是0.5的结果,说明神经网络的作用还是有的,但是在经过对于迭代次数的改变和训练集的改变以后,还是没有能优化到一个更好的结果,于是乎我在考虑是不是应该回过头对特征工程进行进一步的处理,于是这一周的后几天我都是在处理数据集的特征,链接: https://zhuanlan.zhihu.com/p/43225794.在知乎和谷歌的.

2020-10-18 21:10:41 154

原创 数据挖掘第三周周报

数据挖掘第三周周报1、本周工作本周主要是学习了python在数据挖掘的应用,在本周的学习中,学了 很多关于python的用法,包括对csv文本的读入、对矩阵数据的提取,对矩阵数据的分析、对矩阵列的删减、对矩阵空值的填补与剔除,对数据的归一化和标准化等。对数据的提取、矩阵的删减:trainFile = "O:/DataBaseOfPython/train.csv"testAFile = "O:/DataBaseOfPython/testA.csv"pwd = os.getcwd(.

2020-10-09 20:44:58 154

原创 数据挖掘第二周周报

本周由于要学习python来进行数据处理,所以导致进度有点慢,在Rink方面只能是用到的是c++版的1NN,所以结果很不理想,本周着重的是学习使用python去处理数据,在安装python环境方面又踩了不少坑,在百度的帮助下也是花了不少功夫摸索,从https://blog.csdn.net/guoziqing506/article/details/52014506这个网址中学习python对文件的读写,从https://zhuanlan.zhihu.com/p/66050679中可以学习到机器学习中,数据预

2020-10-05 22:28:58 158

原创 数据挖掘第一周周报

#数据挖掘周报##本周数据挖掘的进度主要是在对训练数据的预处理,在拿到训练数据的时候,首先是分析了一下训练数据集,大约

2020-09-28 18:00:20 289

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除