![](https://img-blog.csdnimg.cn/20201014180756918.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
算法
花半夏
这个作者很懒,什么都没留下…
展开
-
Leveinshtein距离
一、定义编辑距离又称Leveinshtein距离。编辑距离是计算两个文本相似的算法之一。 二、常用场景编辑距离是基于文本自身去计算,没办法深入到语义层面,可以胜任一些简单的分析场景,例如拼写检查、抄袭侦测、算法在数据聚合时会有一定的运用。...转载 2019-01-23 11:45:52 · 222 阅读 · 0 评论 -
GBDT+LR simple例子
# 弱分类器的数目n_estimator = 10# 随机生成分类数据。X, y = make_classification(n_samples=80000) # 切分为测试集和训练集,比例0.5X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.5)# 将训练集切分为两部分,一部分用于训练GB...转载 2019-04-19 10:28:22 · 507 阅读 · 0 评论