- 博客(9)
- 收藏
- 关注
原创 Dream 7B扩散语言模型推理实验
根据输入可生成的最大token长度填充整个序列。(此时全序列为待生成的<MASK>状态)。设定timesteps进行调度,此模型中调度策略为线性,即每个时间步生成相同数量的token,所以理论上每步生成的token数应该等于生成循环每次先检查哪些位置是MASK,这些是待生成位置,然后计算所有待生成位置的logits(不需要保存已生成位置的概率分布以节省空间)。根据预定义的参数选择生成位置(哪些词应该在这一步被生成)。
2025-09-25 11:09:10
684
原创 项目4 房屋价格预测
将去掉标签的数据集和测试集合并一起处理,在处理完成后再划分回各自集合。其中np.log1p是对标签列进行对数变化,使整体数据呈正态分布。可以使用以下代码查看对数转换后数据效果,并与标准正态分布进行对比。经过对数处理后可以看出整体数据呈正态分布,Q-Q图结果也表明数据呈正态分布。标签列在处理前整体呈大概泊松分布,需要进行处理。对训练集数据进行拟合并保存结果,查看拟合数据MAE。MAE结果为:13649.486520362263。对数据进行归一化处理可以使得训练效果更好。可以看出在α约为15的时候效果最好。
2023-12-21 16:07:18
845
原创 项目3 贷款情况预测
使用Kaggle中的Loan Prediction Problem DataSet 数据集对申请人的各项情况进行综合评估最后判断是否可以贷款。
2023-12-12 21:49:05
322
原创 项目1 鸢尾花数据分类
构造最大深度为2的决策树,函数中可以指定criterion='entropy' 或 'gini' 未输入默认使用基尼系数。数据集采用经典的iris数据集,分类方法使用基于基尼系数的决策树。查看决策树在训练集和测试集上的分类准确度。加载数据集并对数据集进行分类。首先引入需要的包和数据集。
2023-12-08 10:49:15
138
原创 Chapter1-Stream cipher
In this passage, I will talk about stream cipher and many terminologies related to it.
2023-10-24 18:49:02
180
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅