- 博客(21)
- 收藏
- 关注
原创 机器学习部分面试题小汇总
为什么需要对数值类型的特征做归一化?哪些算法必须做归一化?为什么归一化——数值范围较大的特征会对模型的训练产生过大的影响,导致模型偏向于这些特征,所以需要消除数据特征之间的量纲影响,使得不同指标之间具有可比性。此外,特征的尺度差异会导致权重更新不均衡,影响收敛速度。一些算法对特征的尺度敏感,归一化可以提高模型的稳定性和预测精度。哪些算法必须做归一化?——通过梯度下降法求解模型的通常需要归一化,包括线性回归、逻辑回归、SVM、神经网络等;决策树模型不需要归一化,因为决策树在进行节点分裂时,主要依靠数据集关
2025-02-26 17:20:47
792
原创 ERROR: Could not install packages due to an OSError: [Errno 2] No such file or directory
解决方法:删除错误提示中的文件路径的倒数第二层的文件夹,比如把d:\anaconda\envs\xjqenv\lib\site-packages下的numpy-1.19.0.dist-info删除。原因:通常是因为已经存在其他版本的包了,可在错误提示里的路径下看到有其他版本包了。
2024-07-08 15:13:11
5021
2
原创 深度学习随记
当模型被封装在 nn.DataParallel 中时,我们需要使用模型的 module 属性来获得真正的模型状态字典。(model.module.state_dict())
2023-06-02 20:04:19
75
原创 从content.txt中随机挑选文本并去除其空格和拼音后替换--text后双引号中的文本
【代码】从content.txt中随机挑选文本并去除其空格和拼音后替换--text后双引号中的文本。
2023-05-31 10:54:00
128
1
原创 两种加载gpu并将模型放置到gpu上的方式;python3.6之后的格式化字符方式
说明:torch.device(“cuda”) 表示使用默认的 CUDA 设备(通常是 ID 为 0 的 GPU 设备),而 torch.device(“cuda:1”) 表示使用 ID 为 1 的 CUDA 设备。
2023-05-19 20:22:03
307
1
原创 从dataset说话人说明文件中得到键为说话人ID、值为对应性别ID的JSON文件
【代码】从dataset说话人说明文件中得到键为说话人ID、值为对应性别ID的JSON文件。
2023-05-08 09:49:23
69
原创 UnitTest框架
1.组织用例组织用例(创建TestCase代码文件;一般将多个TestCase放在同一个目录下)在TestCase代码文件中可以用装饰器书写参数化、使用断言、使用夹具Fixture代码块、使用装饰器实现跳过;2.组装(打包)测试用例单个TestCase可以直接运行不需要打包起来再运行了且可生成自带的测试报告。
2023-04-17 15:10:38
44
转载 mp4_to_wav wav_to_duration*nums*new_wav
【代码】mp4_to_wav wav_to_duration*nums*new_wav。
2023-04-12 10:41:15
97
2
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人