- 博客(4)
- 收藏
- 关注
原创 第L4周:机器学习|K-邻近算法模型
背景: 海伦一直使用在线约会网站寻找适合自己的约会对象。尽管约会网站会推荐不同的人选,但她没有从中找到喜欢的人。①不喜欢的人;②魅力一般的人;③极具魅力的人。①每年获得的飞行常客里程数②玩视频游戏所耗时间百分比③每周消费的冰淇淋公升数她希望根据现有的数据来判断一个陌生男人会被她归到哪一类。
2024-09-20 22:19:47 795
原创 第L3周:ML | 逻辑回归 LogisticRegression
逻辑回归(Logistic Regression)是一种广泛应用的机器学习算法,特别适用于分类问题。尽管名字中带有“回归”,但它主要用于解决二分类或多分类问题,而不是回归问题。比如某用户购买某商品的可能性,某病人患有某种疾病的可能性,以及某广告被用户点击的可能性等。 核心思想是将输入特征通过一个线性函数映射到输出,然后使用逻辑函数(Sigmoid函数或Softmax函数)将线性函数的输出转换为概率,从而实现分类。 用于将数据分为两个类别,例如判断邮件是否为垃圾邮件、病人是否患有某
2024-09-19 22:26:15 713
原创 第L2周:ML|线性回归模型
如果你只使用一个特征来预测另一个特征,那么这种情况下模型是可以工作的,但通常这不是机器学习中的标准做法,因为模型将无法从多个特征中学习。这里我们采用“学习时长-成绩”数据集,采用LinearRegression简单线形回归模型,通过学习时长去预测学生成绩。(3) fit 的作用:找到最佳的线性关系,即最佳拟合线,来描述。(2) 这段代码初始化了一个线性回归模型,并使用训练数据集。对象可以用来对新的特征数据进行预测,以估计目标变量的值。
2024-09-19 00:23:46 633
原创 第L1周:ML | 数据预处理
如果数据集中的某些特征或类别的样本数量较少,随机分割可能会导致训练集或测试集中这些特征或类别的表示不均衡。的正太分布,消除不同特征量纲的影响,尤其是像支持向量机 (SVM)、逻辑回归、神经网络等基于梯度的模型。:由于训练集和测试集的样本不同,模型在测试集上的性能可能会有所波动。的形式,这样可以用于机器学习模型的输入,因为大多数模型都需要NumPy数组格式的数据。方法会扫描指定的列,计算非缺失值的均值,并存储这些均值以便后续使用。参数指定了填充缺失值的方法,即用每列的均值来填充该列的缺失值。
2024-09-18 02:11:16 679 2
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人