机器学习
文章平均质量分 96
买奶茶的小孩
这个作者很懒,什么都没留下…
展开
-
机器学习——3.回归与聚类算法
特点分析:采用迭代式算法,直观易懂并且非常实用缺点:容易收敛到局部最优解(多次聚类)注:聚类一般做在分类之前。原创 2022-10-03 21:30:06 · 836 阅读 · 0 评论 -
机器学习——2.分类算法
fit() 计算每一列的平均值、标准差。transform()(x - mean)/ std进行最终的转换。:小数据场景,几千~几万样本,具体场景具体业务去测试。如a(a1,a2,a3),b(b1,b2,b3)标准化:(x - mean)/ std。k值取得过小,容易受到异常点的影响。:简单,易于理解,易于实现,无需训练。——N个样本中随机有放回的抽样N个。——从M个特征中随机抽取m个特征。k值取得过大,样本不均衡的影响。容易受到异常点的影响。新的树的训练集(不是固定的)原创 2022-10-02 13:17:50 · 671 阅读 · 0 评论 -
机器学习——1.Sklearn:特征工程
用来加载获取流行数据集datasets.load_*() :获取小规模数据集,数据包含在datasets中datasets.fetch_*(data_home=None):获取大规模数据集,需要从网络上下载,函数的第一个参数是data_home,表示数据集下载的目录,默认是~/scikit_learn_data/原创 2022-09-29 21:01:58 · 3146 阅读 · 0 评论