sklearn机器学习笔记
文章平均质量分 73
寂ღ᭄秋࿐
这个作者很懒,什么都没留下…
展开
-
AI量化模型预测——baseline学习笔记
本赛事是一个量化金融挑战,旨在通过大数据与机器学习的方法,使用给定的训练集和测试集数据,预测未来中间价的移动方向。参赛者需要理解市场行为的原理,创建量化策略,并利用过去不超过100个数据点的信息,对未来5、10、20、40和60个数据点的中间价进行预测(下跌、不变或上涨)。挑战包含10只股票,79个交易日的数据,其中前64个交易日用于训练,后15个用于测试。数据集包括股票的5档量价、中间价、交易量等信息。原创 2023-08-04 23:41:33 · 777 阅读 · 0 评论 -
清华镜像源——加速地址
pip install xxx -i https://pypi.tuna.tsinghua.edu.cn/simple原创 2022-05-24 12:40:59 · 225 阅读 · 0 评论 -
特征工程——七大特征处理的方法
以下举例采用的数据集为sklearn中自带的数据,因此在此提前进行读取数据,具体代码如下:# 导入包from sklearn.datasets import load_iris# 获得数据iris = load_iris()iris.data运行结果如下:(因为数据过大,因此在此处只进行部分展示)1. 标准化 标准化是依照特征矩阵的列处理数据,即通过求标准分数的方法,将特征转换为标准正态分布,并和整体样本分布相关。每一个样本点都能对标准化产生影响。 标准化需要...原创 2022-03-29 16:20:24 · 5133 阅读 · 0 评论 -
scikit-learn 一般性原理和通用规则
在scikit-learn包含大部分流行的有监督学习算法(分类回归)和无监督学习算法(聚类和数据降维)的实现目录1.评估模型对象2.模型接口fit()接口predict()接口predict_proba()的接口scroe ()接口3.模型检验4.模型选择1.评估模型对象scikit- eam 里的所有算法都以一个评估模型对象来对外提供接口。在机器学习应用开发的典型步骤中,使用支持向量机来训练模型# 使用支持向量机来训练模型from sklearn i原创 2021-10-12 21:33:17 · 161 阅读 · 0 评论 -
机器学习应用开发的典型步骤
目录1.数据采集和标记2.特征选择3.数据清洗4.模型选择5.模型训练6.模型测试7.模型保存与加载8.实例(手写数字识别)1.数据采集和标记2.特征选择3.模型训练4.模型测试5.模型保存与加载6.上述sk-learn模型以及模型参数1.数据采集和标记先采集数据,再将数据进行标记作用:尽可能多的采集的不同的数据,防止出现偶然性,使得采集到的数据具有代表性,才能保证最终训练出来的模型的准确性。2.特征选择选择合适的特征,将数据保..原创 2021-10-12 20:25:20 · 599 阅读 · 0 评论