机器学习
文章平均质量分 55
机器学习算法和coding
aigonna
这个作者很懒,什么都没留下…
展开
-
5. KFold, StratifiedKFold,StratifiedShuffleSplit, GroupKFold区别以及Stratified Group KFold
5. KFold, StratifiedKFold,StratifiedShuffleSplit, GroupKFold区别以及Stratified Group KFold原创 2021-09-11 22:37:29 · 2800 阅读 · 0 评论 -
4. Categorical Encoding with CatBoost Encoder
4. Categorical Encoding with CatBoost Encoder记录下CatBoost Encoder 特征编码,来自于Categorical Encoding with CatBoost Encoder。大部分机器学习算法要求数据是数字格式的,对于类别这种非数字格式,我们要将其转换为数字形式。方法非常多,Catboost使用的是target-based categorical 编码。其计算公式为:TargetCount+priorFeatureCount+1(1)\fr原创 2021-09-10 18:31:57 · 1102 阅读 · 0 评论 -
3.LGBM 无法使用GPU tree
问题描述:在使用LGBM是设置GPU以及ID后 'device': 'gpu', 'gpu_platform_id': 0, 'gpu_device_id': 0, 使用出现:LightGBMError: GPU Tree Learner was not enabled in this build.Please recompile with CMake option -DUSE_GPU=1解决方案:LGBM编译有要求,最好要加上 -DUSE_GPU=1.git clone --recursiv原创 2021-08-25 14:46:34 · 1710 阅读 · 0 评论 -
2. t-NSE 可视化
1. t-NSE 可视化t-SNE是t-Distributed Stochastic Neighbor Embedding简写,出自Visualizing Data using t-SNE论文。t-SNE是一种非线性降维算法,通过原始空间和嵌入空间的联合概率的KL散度来评估降维到嵌入空间的效果,就是用KL散度的函数作为loss函数,然后通过梯度下降最小化loss函数,最终获得收敛结果。并且t-SNE计算复杂度高。下面是t-SNE可视化手写数字的代码:import numpy as npimport原创 2021-07-31 21:03:24 · 1687 阅读 · 0 评论 -
1.sklearn AttributeError: ‘str‘ object has no attribute ‘decode‘
LogisticRegression 报错 AttributeError: ‘str’ object has no attribute ‘decode’stackoverflow解答解决办法将求解器指定为liblinear:logreg = LogisticRegression(solver='liblinear', class_weight="balanced")原创 2021-05-08 11:23:44 · 845 阅读 · 4 评论