- 博客(2)
- 资源 (2)
- 收藏
- 关注
原创 达观杯数据竞赛第二天打卡
1、理解tf-idfTF-IDF(term frequency–inverse document frequency)是一种用于信息检索与数据挖掘的常用加权技术。TF意思是词频(Term Frequency),IDF意思是逆文本频率指数(Inverse Document Frequency)。scikt-learn类库的TfdfTransformer类可以通过将单词频数向量矩阵转换为一个标准化...
2019-04-07 21:51:10
736
原创 达观杯数据竞赛第一天打卡
达观杯数据竞赛第一天打卡下载数据,读取数据,观察数据将训练集拆分为训练集和验证集分享自己对数据以及赛题的理解和发现下载数据,读取数据,观察数据将训练集拆分为训练集和验证集分享自己对数据以及赛题的理解和发现这个是我第一次写博客、第一次用 Markdown编辑器,而且时间挺着急的,中间可能会有很多不熟悉和错误,也是记录下自己的小成长。这个竞赛是DC的,需要去官网注册、报名才能下载。会给一个网...
2019-04-05 21:54:54
147
winequality-red.csv
2019-03-19
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人