自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(7)
  • 收藏
  • 关注

原创 XGBoost的参数使用说明

直接调用XGBoost–import xgboost as xgb与scikit-learn一起使用– from xgboost import XGBClassifier其使用的步骤:     • 1. 构造学习器实例         – 模型参数在构造时传递     • 2. 模型训练:fit/GridSearchCV     • 3. 预测• xgboost.XGBC...

2018-12-24 16:50:16 3210

原创 XGBoost

根据目标函数用泰勒展开式进行展开   

2018-12-24 16:25:41 99

原创 机器学习训练的评价指标

线性回归的评价指标:RMSEMAER2_score  R2_score越大越好,比如完全拟合,预测值和真实值一样,其残差就为0,则R的平方就为1。 Logistic 回归log_lossneg_logloss越大越好。 ...

2018-12-22 10:38:29 851

原创 决策树

决策树:从根节点开始一步步走到叶子节点(决策),既可以做分类也可以做回归。树有以下几部分组成:根节点:第一个选择点非叶子节点与分支:中间过程叶子节点:最终的决策结果决策树特征的切分通过一种衡量标准,来计算通过不同特征进行分支选择后的分类情况,找出来最好的那个当成根节点。衡量标准-熵熵:熵是表示随机变量不确定性的度量(解释:说白了就是物体内部的混乱程度,比如杂...

2018-12-19 16:49:47 392

原创 关于 python下的路径

import osc_root=os.getcwd()+os.sep+"source_data"+os.sepc_root'/home/shnu/demo/NLP/第九章/source_data/'os.getcwd() 获取当前的路径'/home/shnu/demo/NLP/第九章'os.sep'/' ...

2018-12-12 14:24:01 187

原创 NLP之常见关键词提取算法运用

1.TextRank# -*- coding=utf8 -*-from jieba import analyse# 引入TextRank关键词抽取接口textrank = analyse.textrank #原始文本text = "央视网消息:全球首个以进口为主题的国家级博览会——中国国际进口博览会,11月5日将在上海举办,来自130多个国家和地区的2800多家企业、国内外超过15万...

2018-12-01 15:08:31 3465

原创 NLP调试常见的错误

import jieba.posseg as psgseg_list = psg.cut(sentence)print(" ".join(seg_list))TypeError: sequence item 0: expected str instance, pair found解决办法:词性分词的时候不能用join方法,要分别要将其词和词性分别取出,才能从生成器里面看到结果i...

2018-12-01 14:43:22 614 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除