数据科学
AI生成曾小健
"AI生成曾小健2"是该号副号。AI生成式技术,计算机博士;llama3、Baichuan2、Qwen、GLM-4等等项目贡献人(ArtificialZeng)。这个博客的主题主要是AI生成式技术、AI相关技术、机器/深度学习论文或科研前沿、GNN图神经网络、神经网络,包括人工神经网络和生物神经网络,及其大脑演化,智能和认知的产生,通用人工智能;
如果需要看商科/金融相关的请移步CSDN: 量化交易曾小健(金融号)
展开
-
Kaggle 大模型竞赛- LLM 科学考试LLM Science ExamUse LLMs to answer difficult science questions
比赛目标受OpenBookQA 数据集的启发,本次竞赛要求参与者回答由大型语言模型编写的基于科学的困难问题。您的工作将帮助研究人员更好地了解法学硕士自我测试的能力,以及法学硕士可以在资源有限的环境中运行的潜力。语境。原创 2023-09-23 20:09:01 · 284 阅读 · 0 评论 -
可解释机器学习:SHAP 值
基本思想:计算一个特征加入到模型时的边际贡献,然后考虑到该特征在所有的特征序列的情况下不同的边际贡献,取均值,即某该特征的SHAP baseline value。基本思想:计算一个特征加入到模型时的边际贡献,然后考虑到该特征在所有的特征序列的情况下不同的边际贡献,取均值,即某该特征的SHAPbaseline value。中的代码,发现0.39.0版本,跟之前的版本差异非常大,很多函数名称都发生了变化。SHAP 就可以应用的上,来看一下SHAP呈现的几种图,本轮笔者 是直接拿。的方法,它的核心思想是。原创 2022-08-24 10:59:40 · 4043 阅读 · 0 评论 -
特征工程2之 . 时序值衍生的特征
另一种特征叫做扩展窗口统计(Expanding Window Statistics),其实也算是一种特殊的滑动窗口统计,不过他用来统计的数据是整个序列全部的数据,统计值可以是平均数、中位数、标准差、最大值、最小值等,这种特征一般是用在多序列建模,比如不同的股票价格,可能会有着不同的内在属性,在预测的时候用这个特征作为区分也是一种方式。作为特征,这里指定的window就是7,也可以根据需要指定14,30等,可以发现,上面说的。,然后滑动窗口统计也是可以指定滞后的期数来衍生出更多的特征的,比如。...原创 2022-08-18 15:54:18 · 178 阅读 · 0 评论 -
Tweetie分布
Tweedie分布在商业场景中有很多例子,比如人们进入某个商城后的消费额。,Tweedie分布最明显的一个特点是。以一定的概率生成数值为0的样本。Tweetie分布是一种。中有很多例子,例如,数据。原创 2022-08-18 15:15:51 · 385 阅读 · 0 评论 -
Jpx股价预测比赛
该数据集包含各种日本股票和期权的历史数据。你的挑战是预测股票的未来回报。由于历史股票价格不是保密的,这将是使用时间序列 API 进行的预测竞赛。公共排行榜期间的数据包含在竞赛数据集中。期待看到许多人为了好玩而提交完美的提交。因此,本次比赛的活跃阶段公共排行榜旨在为任何想要测试其代码的人提供便利。预测阶段排行榜将使用提交期结束后收集的真实市场数据确定。文件stock_prices.csv 感兴趣的核心文件。包括每只股票的每日收盘价和目标栏。options.csv 基于大盘的各种期权的状态数据。许多选原创 2022-06-18 21:29:35 · 206 阅读 · 0 评论 -
首届电子商务AI算法大赛 Organized by automlai
Quick Start可以尝试以下开源自动机器学习算法包 获取baseline效果。效果对比:--- AutoX AutoGluon H2o mse 1.1426 1.9466 1.1927 初赛、复赛线上评分排名规则初赛、复赛线上采用Mean squared error(MSE)进行评分排名,MSE越小排名越高,其中,MSE的定义如下:其中,ytrue是真实销量,yPredict是预测销量,nsample...原创 2021-08-11 14:51:52 · 300 阅读 · 0 评论 -
逻辑回归与线性回归是什么关系呢?
逻辑回归与线性回归是什么关系呢?逻辑回归(Logistic Regression)与线性回归(Linear Regression)都是一种广义线性模型(generalized linear model)。逻辑回归假设因变量 y 服从伯努利分布,而线性回归假设因变量 y 服从高斯分布。 因此与线性回归有很多相同之处,去除Sigmoid映射函数的话,逻辑回归算法就是一个线性回归。可以说,逻辑回归是以线性回归为理论支持的,但是逻辑回归通过Sigmoid函数引入了非线性因素,因此可以轻松处理0/1分类问题。原创 2021-08-11 11:12:37 · 2293 阅读 · 1 评论 -
Kaggle Future Sales“”竞赛 XGB_model_final
介绍“未来销售"Future Sales"”竞赛是HSE莫斯科大学“高级机器学习”专业“如何赢得数据科学”课程的最终评估。目标是根据历史数据预测特定商店中商品的每月销售额。销售数量在 0 到 20 之间。import numpy as np import pandas as pd import matplotlib.pyplot as pltimport seaborn as snsfrom sklearn.metrics import mean_squared_errorfrom ...原创 2021-08-03 13:47:15 · 140 阅读 · 0 评论