![](https://img-blog.csdnimg.cn/20201014180756918.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
机器学习
Saphon
我都要
展开
-
Python机器学习库记录
模型训练操作:数据划分:sklearn.model_selection.train_test_split超参自动搜索:sklearn.model_selection.GridSearchCV预测报告生成:sklearn.metrics.classification_report / sklearn.metrics.confusion_matrix解析xml树:import xml.etre...原创 2019-08-03 17:49:05 · 200 阅读 · 0 评论 -
k-means和knn的区别
k-means是聚类(无监督学习),先定好k个类别,然后随机确定k个坐标(聚类中心),各点离哪个坐标近就算做哪类,然后不停算平均值求出中心,直到稳定,聚类完成。有训练的过程。k-means++使初始的聚类中心坐标相距尽可能远。knn = k nearest neighbor是分类(监督学习),定好k直接把待分类点周边最近的k个点计数,数量多的那类定为待分类点的类别。无训练的过程。...原创 2019-08-03 17:50:11 · 3341 阅读 · 0 评论 -
LSTM与GRU的扼要理解
LSTM:三个门 - 遗忘门、输入门、输出门门可以理解为mask,用来过滤筛选信息。单次输入、细胞状态、单次输出,均是列向量。即总的输入是一连串的列向量。解释:除去最右边的蓝色tanh,其他每一个激活函数图标,都代表着 f(Wx+b) 即激活一个线性运算。三个门共四个要激活的线性运算,代表着四对可训练的矩阵W和截距b。这四对参数才是LSTM训练过程中真正在训练的东西。由于细胞状态c与隐状态...原创 2019-08-03 19:23:05 · 673 阅读 · 0 评论 -
一个机器学习模型的应用架构
dataset文件夹xxx.csv数据文件data_process文件夹xxx.py含处理数据的各函数.configs文件夹xxx.json模型配置文件,比如LSTM.json,记录超参数等models文件夹model.py一个不含实际内容的超类Model类Sequential.py继承Model类的子类Sequential类在__init__初始化的过程...原创 2019-08-04 02:39:28 · 1814 阅读 · 0 评论 -
利用feature-selector进行特征选择
dataset = pd.read_csv(’/content/drive/My Drive/test_lightGBM/EUR_USD_NEWS_SOCIAL_daily_fe.csv’)y = dataset[‘bid_chg_on’].valuesx = dataset.drop(columns=[‘date’,‘bid_chg_on’,‘ask_chg_on’,‘bid_chg_1w’...原创 2019-08-07 21:53:43 · 1741 阅读 · 0 评论