![](https://img-blog.csdnimg.cn/20201014180756738.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
机器学习
test
麦片加奶不加糖
NUS研究生毕业 目前互联网行业工作
爱好编程 | 机器学习 | 数据分析 | 炒股
展开
-
达观数据比赛 第六天任务
终极boss来啦,哈哈哈哈,通过这半个月以来的学习,走完了一个简单的nlp任务的学习,从初探数据到TF-IDF,到学习Word2Vec,然后开始使用几个常见的模型和集成模型LightGBM,最后要开始要对模型进行调参和整合了。【任务4 模型优化】时长:2天1)进一步通过网格搜索法对3个模型进行调优(用5000条数据,调参时采用五折交叉验证的方式),并进行模型评估,展示代码的运行结果。(可...原创 2019-04-14 22:09:12 · 227 阅读 · 0 评论 -
达观数据比赛 第五天任务
今天学习lightbgm算法,算是一种比较不错的轻量级的集成算法把~【任务 3.2】LightGBM模型 时常:2天构建LightGBM的模型(包括:模型构建&调参&性能评估),学习理论并用Task2的特征实践LightGBM有更快的训练速度和更高的效率,这是因为它是一种使用基于直方图的算法。例如,它将连续的特征值分桶(buckets)装进离散的箱子(bin...原创 2019-04-13 22:25:02 · 234 阅读 · 0 评论 -
达观数据比赛 第四天任务
在学习完nlp预处理TF-IDF和Word2Vec之后,终于要进入模型的学习和使用啦。【任务3.1】LR+SVM 时常:2天使用下面模型对数据进行分类(包括:模型构建&调参&性能评估),并截图F1评分的结果。1)逻辑回归(LR)模型,学习理论并用Task2的特征实践2)支持向量机(SVM) 模型,学习理论并用Task2的特征实践首先我们来了解一下逻辑回...原创 2019-04-10 14:07:27 · 602 阅读 · 0 评论 -
达观数据比赛 第三天任务
清明节结束,恢复上班日常啦。【任务2.2】时长: 2天学习word2vec词向量原理并实践,用来表示文本。我们可以把word2vec模型简单化地看成是神经网络。如下图所示, 输入是一个one-hot向量,通过中间层(不含激活函数),输出层和输入层纬度一样Word2Vec一般分为CBOW(Continuous Bag-of-Words )与Skip-Gram两种模型。...原创 2019-04-09 10:31:46 · 424 阅读 · 0 评论 -
达观数据比赛 第二天任务
完成了对达观数据的初次尝试之后,现在开始要正儿八经地开始搞一搞nlp的东西了。清明节假期第三天ing,也该收收心了,简单得用CSDN来记录本次学习任务,并完成打卡吧~【任务2.1】时常:2天1.学习TF-IDF理论并实践,使用TF-IDF表示文本。今天我们来学习一个在nlp领域里重要的概念,这个概念自己在之前硕士阶段数据挖掘以及大数据分析课程中,也是已经有过一定的了解。今天...原创 2019-04-07 10:34:59 · 197 阅读 · 0 评论 -
达观数据比赛 第一天任务
li首先很高兴可以报名参加Datawhale第六期达观你nlp数据分析学习。第一次接触到和nlp有关的数据分析任务,还是很激动的 :)鉴于清明节假期ing,学习时间有所减少,简单得用CSDN来记录本次学习任务,并完成打卡吧~【任务1 -数据初识】时长:1天下载数据,读取数据,观察数据 将训练集拆分为训练集和验证集 分享自己对数据以及赛题的理解和发现首先我从百度云盘上下...原创 2019-04-05 20:20:24 · 277 阅读 · 0 评论