![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
机器学习
文章平均质量分 72
x.h.z
build yourself
展开
-
DARNN论文解读
什么什么seq2seq结构不是搞机器翻译的吗,咋也可以用在序列预测方面,在最近看到的一篇论文中,作者用他的DARNN模型实现了股票的预测,想来整理总结一下这篇论文预备知识在文章开始之前,先来了解下什么是seq2seq结构,seq2seq其实是深度学习中一种模型的架构,主要用于的是机器翻译领域,其实本质上就是用了两个循环神经网络将一个语言序列直接转换为了另外一个语言序列,在这里,循环神经网络可以简单理解为一个动力系统,可以自主学习一组片段(句子,信号这类等)的序列中的关系,能够通过前面的状态来预测后面的状态,原创 2021-09-03 11:20:29 · 1289 阅读 · 1 评论 -
Bert环境的搭建
Bert作为文本分类的一个预训练模型,在阿里天池赛题上有一个题目阿里天池文本分类在这里需要用到的库是bert4keras,可以参考的一个版本如下conda create -n bert python==3.7conda activate bertpip install tensorflow == 1.14.0 keras == 2.3.1 bert4keras == 0.8.4...原创 2021-08-12 11:00:41 · 391 阅读 · 0 评论 -
PaddleNlp无法安装解决方案
在原有的conda环境下直接安装paddlenlp库会报出setuptools等一连串错误,解决方案是可以参考github上的paddlenlp库的issue,有人已经给出了解决方案issue地址所以只能重新创建一个conda环境conda create -n my_paddlenlp python=3.7 conda activate my_paddlenlp conda install paddlepaddle --channel https://mirrors.tuna.tsinghua.原创 2021-07-26 15:25:29 · 3790 阅读 · 3 评论 -
时序预测工具-Prophet镜像安装
今天下午更新代码时发现docker里的prophet容器进程突然挂掉,在排查之后选择重新进行了安装,并在此之上用了gunicorn管理flask服务,网上的博客很多都不是很靠谱,于是乎我对整个安装过程进行了记录,希望能帮助到同样在docker上部署prophet镜像服务遇到此问题的朋友们主要产生的问题,还是在于「pystan库与fbprophet库同时安装的冲突」安装过程1.选择拉取一个python镜像,也可以直接拉取一个anaconda镜像,后者的库更多,这里我们选择「python3.8」版本,同时在安装原创 2021-06-29 15:44:00 · 843 阅读 · 0 评论 -
工业蒸汽预测baseline-模型评估与特征重组篇
由于一段时间的断更,关于工业蒸汽预测的赛题,只记录到了模型训练部分,今天来看下模型训练后常用的模型检验,评估方法,以及如何使用特征组合去提升特征的质量文章开始之前,有必要了解下相关的概念模型评估的概念和方法欠拟合和过拟合数据关系是样本的分布规律,或者是特征与对应样本之间的关系,如果一个模型恰到好处的表达了数据之间的关系时,我们就认为这个模型拟合效果好,欠拟合(underfitting)也叫做高偏差(bias),是指算法训练的模型不能完整的表达数据关系,在这种情况下需要增加额外的特征,增加多项式特征等方法来优原创 2021-06-18 20:24:36 · 203 阅读 · 1 评论 -
以nba球员数据学习聚类算法
由于一些小需求,需要学习下聚类算法,大二有段时间曾因为比赛学习过聚类,当时还看了好几遍吴恩达老师的视频,真心不错但时至今日,知识尽数忘却,故重新拾起,本篇文章将结合一个简单的例子,简单总结下聚类基础的知识以及如何快速使用学聚类算法时,我会问自己,聚类算法解决了什么问题?他和分类算法有什么区别,它有什么实际的应用物以类聚,人以群分,世间万物都有相似的特征,人格特征,情感特征,形象特征等等,一张图片有很多个像素,我想要保持图片清晰度良好的情况下尽量减小图片的size,从而减少存储与通信消耗,便可以通过聚类去缩减原创 2021-05-08 15:59:13 · 3168 阅读 · 5 评论 -
阿里天池工业蒸汽量预测baseline-数据探索篇
赛题介绍本题是很经典的特征预测题,网上有很多大佬的baseline,但是我觉得还是看官方出的赛题书好一些,这一节,总结了该题中如何去分析原始数据的思路与常用方法赛题数据与代码在文末我的github链接里,需要的朋友可以去pull下看,喜欢的话,给个star哈赛题数据赛题提供了训练集和测试集,训练集提供了38个特征变量和一个target(预测目标)变量,测试集只提供了38个特征变量,我们的目标就是使用训练集训练出来的模型,结合测试集中的特征变量去预测target字段# 数据探索import nu原创 2021-04-09 21:43:10 · 960 阅读 · 1 评论