机器学习
KerwinChou_CN
这个作者很懒,什么都没留下…
展开
-
特征工程中缺失值处理
特征工程中缺失值处理缺失值极多:把该特征直接舍弃非连续特征缺失值适中:把NaN作为一个新类别连续特征缺失值适中:给定一个step,离散化,把NaN作为一个type放入到特征中缺失值较少:利用填充的方法进行处理,常见的有均值,众数,中位数填充;用sklearn中的RandomForest模型区拟合数据样本训练模型,然后去填充缺失值;拉格朗日插值法...原创 2019-02-15 17:04:38 · 1629 阅读 · 1 评论 -
tesseract和PIL对图片验证码进行识别
原图:灰度处理+二值化处理,即可得到下边类似于这样的图片from PIL import Image import pytesseract def img_handle(img_path): img = Image.open(img_path) # img.show() # 灰度处理 img_grav = img.convert("L...原创 2019-07-30 19:50:12 · 178 阅读 · 0 评论 -
超参数调优方法
超参数调优方法网格搜索随机搜索贝叶斯优化超参数搜索算法一般包括以下要素:目标函数,即算法需要最大化、最小化的目标;搜索范围,一般通过上限和下限来确定;算法的其他参数网格搜索最简单,应用最广泛的超参数搜索算法通过查找搜索范围内的所有的点来确定最优值如果采用较大的搜索范围以及较小的步长,网格搜索有很大概率找到全局最优值这种搜索方案十分消耗计算资源和时间,特别是需要调优的超参数比较...原创 2019-09-04 16:32:44 · 1775 阅读 · 0 评论