机器学习
机器学习
For Coding
这个作者很懒,什么都没留下…
展开
-
求最长公共子串长度与最长公共子串问题/求最长公共子序列长度与最长公共子序列问题
import numpy as np str1 = 'abaccb' str2 = 'aaccab' tmp_str1 = str1 tmp_str2 = str2 str1 = '0' + str1 str2 = '0' + str2 len1 = len(str1) len2 = len(str2) dp = np.zeros((len1, len2), dtype=np.int) for i in range(1, len1): for j in range(1, len2):原创 2021-03-10 15:04:56 · 156 阅读 · 0 评论 -
不平衡数据集的处理
所谓的不平衡数据集指的是数据集各个类别的样本量极不均衡。以二分类问题为例,假设正类的样本数量远大于负类的样本数量,通常情况下通常情况下把多数类样本的比例接近100:1这种情况下的数据称为不平衡数据。不平衡数据的学习即需要在分布不均匀的数据集中学习到有用的信息。 不平衡数据集的处理方法主要分为两个方面: 1、从数据的角度出发,主要方法为采样,分为欠采样和过采样以及对应的一些改进方法。 2、从算法的角度出发,考虑不同误分类情况代价的差异性对算法进行优化,主要是基于代价敏感学习算法(Cost-Sensitive原创 2021-02-21 20:14:16 · 725 阅读 · 0 评论 -
机器学习-决策树的快速入门案例
机器学习-决策树的快速入门案例 案例:利用决策树分析,数据集利用sklearn 中的红酒数据集,进行红酒数据集的分类操作 代码实现: from sklearn.tree import DecisionTreeClassifier from sklearn.model_selection import train_test_split, cross_val_score import matplotlib.pyplot as plt import numpy as np import pandas as pd原创 2020-05-12 21:59:28 · 156 阅读 · 0 评论