- 博客(64)
- 收藏
- 关注
原创 数字医疗算法应用创新大赛-食品与疾病关系预测算法赛道top5方案分享
本次算法赛将提供超过 23.5W 的食物、疾病对应关系及其量化得分,其中食物特征超过 200 个,疾病特征由 3 种不同的方式抽取,累积超过 4000 个特征信息。本赛道将提供脱敏后的食物与疾病特征,参赛团队根据主办方提供数据,在高度稀疏数据的场景中,进一步挖掘、融合特征并设计模型,以预测食物与疾病的关系。按照LGBM的特征重要性排序,将重要性靠前的特征进行特征交叉,由于复赛进行交叉过拟合严重,所以只选取前5的特征(食物特征)进行乘法和除法的交叉。L2范数最小化特征矩阵距离,对抗学习等等。
2023-05-05 17:33:39
555
1
原创 ChatGPT全面升级,GPT4支持多模态数据。
未来,如果GPT再次升级,能够支持更多类型的数据,诸如语音,视频,照片,文本等等,并且接入互联网能够抓取实时信息的时候,或许真的能够进入新的AI时代。最后,OpenAI已经明确了GPT4将会在对话,购物,反欺诈,金融,教育,保护文化遗产 等多个领域进行商业应用,新的AI时代即将开启?目前,OpenAI正在ChatGPT Plus上提供GPT-4(当然,需要打钱),另外,微软的New Bing也用上了GPT-4。不同于ChatGPT,GPT4是支持多模态数据,目前上去看了下,支持图片和文本两种数据格式。
2023-03-15 10:36:41
5046
3
原创 DenseNet学习(使用tf和torch构建)
DenseNet模型的基本思路与ResNet一致,但是它建立的是前面所有层与后面层的密集连接(dense connection),它的名称也由此而来。DenseNet的另一个特色是通过特征在channel上的连接来实现特征重用。这些特点让DenseNet在参数和计算成本更少的情形下实现比ResNet更优的性能,DenseNet也因此斩获CVPR 2017的最佳论文奖。
2023-03-03 19:12:41
53
原创 学习如何使用GPT2进行文本生成(torch+transformers)
GPT2是OPen AI发布的一个预训练语言模型,见论文《Language Models are Unsupervised Multitask Learners》,GPT-2利用单向Transformer的优势,做一些BERT使用的双向Transformer所做不到的事。那就是通过上文生成下文文本。理论部分的文章有很多,这里不做深究,下面直接看代码吧。
2023-02-07 09:15:24
1213
1
原创 酒店预订订单的分析与建模【决策树、xgboost】
# 酒店预订订单的分析与建模【决策树、xgboost】## 本项目包含**1.数据处理****2.数据探索性分析****3.网格搜索对决策树、xgboost进行模型参数调优****4.基于五折交叉验证的决策树、xgboost模型预测**
2023-02-02 21:21:37
593
原创 sns.kdeplot报错:ValueError: could not convert string to float: ‘INN00001‘
sns.kdeplot报错:ValueError: could not convert string to float: 'INN00001'
2023-02-01 15:37:03
112
原创 使用线性回归、LGBM对二手车价格进行预测
使用线性回归、LGBM对二手车价格进行预测本项目包含1.数据处理2.数据可视化3.构建模型预测二手车价格
2023-01-03 17:10:52
1101
原创 python解决报错ImportError: Bad git executable.
python解决报错ImportError: Bad git executable.
2022-12-07 23:08:05
5366
6
原创 电商评论文本情感分类(中文文本分类+中文词云图)(第一部分-textcnn)
电商评论文本情感分类(中文文本分类+中文词云图)1.中文文本处理2.中文词云图绘制3.中文词嵌入4.基于textcnn的中文文本分类(Test_Acc=89.2000)
2022-12-04 22:47:40
899
原创 英文诗歌数据-绘制英文词云图+英文本文分类(pytorch)
英文诗歌数据-绘制词云图+本文分类(pytorch)1.文本处理 2.词云图绘制 3.文本分类
2022-11-28 14:07:16
586
原创 pandas.core.series.Series转为DataFrame
pandas.core.series.Series转为DataFrame
2022-11-27 15:22:13
502
原创 Pandas计算DataFrame的所有列的行总值、均值、最大值、最小值、极差、方差
Pandas计算DataFrame的所有列的行总值、均值、最大值、最小值、极差、方差
2022-11-23 16:18:27
1531
原创 Numpy生成数总结(随机整数randint,固定步长arange,分布)
Numpy生成数总结(随机整数randint,固定步长arange,正态分布,均匀分布)
2022-11-22 16:01:56
1173
原创 DataFrame取值操作总结(取指定列指定值的行)
包含:1.如何创建DataFrame2.DataFrame取指定列指定值的行3.DataFrame按照条件取值
2022-11-21 15:44:43
6045
原创 LSTM介绍
长期短期记忆网络 - 通常简称为“LSTM” 是一种特殊的RNN,能够学习长期依赖关系。它们由Hochreiter&Schmidhuber(1997)引入,并在随后的工作中被许多人完善和推广.它们在各种各样的问题上工作的非常好,现在被广泛使用。LSTM 被明确设计为避免长期依赖问题。长时间记住信息实际上是他们的默认行为,而不是他们努力学习的东西!所有RNN都具有神经网络的链式重复模块。在标准RNN中,这个重复模块将具有非常简单的结构,例如单个tanh层。
2022-11-15 09:41:12
808
原创 dataframe中,只要某列存在某个值,就删除该行
今天遇到一个没接触过的东西,需求是:dataframe中,只要某列存在某个值,就删除该行更具体一些,就是数据df中,有一些列的值为0,而只要某列的某行是0,我就需要删除该行,一开始用了一些不优雅的做法,但由于数据量很大,解决起来很麻烦,经过不断尝试,找到了一种优雅而便捷的方法:
2022-11-08 16:17:03
1683
原创 【已解决】paddleocr:ERROR: Could not build wheels for lanms-neo, which is required to install pyproject
pip安装paddleocr报错:ERROR: Could not build wheels for lanms-neo, which is required to install pyproject.toml-based projects
2022-11-07 16:52:52
6139
20
原创 风控学习:基于逻辑回归构建一张简单的评分卡
1.数据集来源为kaggle,因为是一个demo,且需要验证结果,所以仅取其训练集;2.本项目主要为了说明构建一张简单的基于逻辑回归的评分卡(A卡,也就是贷前)的过程,所以省略了EDA的部分,仅仅做一个简单的流程说明
2022-11-07 15:35:33
316
五折交叉验证决策树、xgboost进行酒店预订是否取消的的预测
2023-02-07
python绘制圣诞树源码
2022-12-24
使用python绘制爱惜-爱心源码
2022-12-24
使用python实现元旦倒计时
2022-12-21
简单实现图像-文本跨模态检索-pytorch
2022-12-20
python雪夜圣诞树源码+示意图.zip
2022-12-16
卷积神经网络(CNN)入门总结-基于tensorflow2
2022-12-08
电商评论文本情感分类(中文文本分类+中文词云图)(第一部分-textcnn)
2022-12-05
电商评论文本情感分类(中文文本分类)(第二部分-Bert)
2022-12-05
英文诗歌数据-绘制词云图+本文分类(pytorch)
2022-11-30
T-SNE三维可视化python代码
2022-11-23
T-SNE二维可视化python代码
2022-11-23
K-means聚类后三维可视化代码
2022-11-23
K-Means二维可视化代码(带生成数据)
2022-11-23
xgboost训练、评估与模型的保存、加载及使用
2022-11-17
kaggle诗歌分类数据集NLP(自然语言处理)方法进行文本分类
2022-10-30
kaggle诗歌文本分类数据集NLP
2022-10-30
多机器学习模型融合进行客户购买预测
2022-10-28
金融贷前数据集用于构建风控模型和评分卡
2022-10-28
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人