算法
花半夏
这个作者很懒,什么都没留下…
展开
-
Leveinshtein距离
一、定义 编辑距离又称Leveinshtein距离。编辑距离是计算两个文本相似的算法之一。 二、常用场景 编辑距离是基于文本自身去计算,没办法深入到语义层面,可以胜任一些简单的分析场景,例如拼写检查、抄袭侦测、算法在数据聚合时会有一定的运用。...转载 2019-01-23 11:45:52 · 219 阅读 · 0 评论 -
GBDT+LR simple例子
# 弱分类器的数目 n_estimator = 10 # 随机生成分类数据。 X, y = make_classification(n_samples=80000) # 切分为测试集和训练集,比例0.5 X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.5) # 将训练集切分为两部分,一部分用于训练GB...转载 2019-04-19 10:28:22 · 505 阅读 · 0 评论