- 博客(7)
- 收藏
- 关注
原创 XGBoost的参数使用说明
直接调用XGBoost–import xgboost as xgb与scikit-learn一起使用– from xgboost import XGBClassifier其使用的步骤: • 1. 构造学习器实例 – 模型参数在构造时传递 • 2. 模型训练:fit/GridSearchCV • 3. 预测• xgboost.XGBC...
2018-12-24 16:50:16 3210
原创 机器学习训练的评价指标
线性回归的评价指标:RMSEMAER2_score R2_score越大越好,比如完全拟合,预测值和真实值一样,其残差就为0,则R的平方就为1。 Logistic 回归log_lossneg_logloss越大越好。 ...
2018-12-22 10:38:29 851
原创 决策树
决策树:从根节点开始一步步走到叶子节点(决策),既可以做分类也可以做回归。树有以下几部分组成:根节点:第一个选择点非叶子节点与分支:中间过程叶子节点:最终的决策结果决策树特征的切分通过一种衡量标准,来计算通过不同特征进行分支选择后的分类情况,找出来最好的那个当成根节点。衡量标准-熵熵:熵是表示随机变量不确定性的度量(解释:说白了就是物体内部的混乱程度,比如杂...
2018-12-19 16:49:47 392
原创 关于 python下的路径
import osc_root=os.getcwd()+os.sep+"source_data"+os.sepc_root'/home/shnu/demo/NLP/第九章/source_data/'os.getcwd() 获取当前的路径'/home/shnu/demo/NLP/第九章'os.sep'/' ...
2018-12-12 14:24:01 187
原创 NLP之常见关键词提取算法运用
1.TextRank# -*- coding=utf8 -*-from jieba import analyse# 引入TextRank关键词抽取接口textrank = analyse.textrank #原始文本text = "央视网消息:全球首个以进口为主题的国家级博览会——中国国际进口博览会,11月5日将在上海举办,来自130多个国家和地区的2800多家企业、国内外超过15万...
2018-12-01 15:08:31 3465
原创 NLP调试常见的错误
import jieba.posseg as psgseg_list = psg.cut(sentence)print(" ".join(seg_list))TypeError: sequence item 0: expected str instance, pair found解决办法:词性分词的时候不能用join方法,要分别要将其词和词性分别取出,才能从生成器里面看到结果i...
2018-12-01 14:43:22 614 1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人