- 博客(5)
- 资源 (1)
- 收藏
- 关注
原创 “达观杯”文本智能处理挑战赛-任务五
一、LightGBM模型1.简介顾名思义,lightGBM包含两个关键点:light即轻量级,GBM 梯度提升机。LightGBM 是一个梯度 boosting 框架,使用基于学习算法的决策树。它可以说是分布式的,高效的,有以下优势:更快的训练效率低内存使用更高的准确率支持并行化学习可处理大规模数据2. 特点概括来说,lightGBM主要有以下特点:基于Histogram的决...
2019-04-13 22:14:53 167
原创 “达观杯”文本智能处理挑战赛-任务四
一、逻辑回归(LR)模型1. 逻辑回归(LR)原理LR模型是在线性回归的基础上,把特征进行线性组合,再把组合的结果通过一层sigmoid函数映射成结果是1或是0的概率。2. 代码实现import picklefrom sklearn.linear_model.logistic import LogisticRegressionfrom sklearn.model_selection ...
2019-04-11 21:32:20 130
原创 “达观杯”文本智能处理挑战赛-任务二
一、TF-IDF理论1.百科介绍:TF-IDF(term frequency–inverse document frequency)是一种用于信息检索与数据挖掘的常用加权技术。TF意思是词频(Term Frequency),IDF意思是逆文本频率指数(Inverse Document Frequency)。2.原理TF在一份给定的文件里,词频(term frequency, TF)指的是...
2019-04-07 20:56:12 595
第1章 数据库基础知识
2017-09-14
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人