- 博客(8)
- 收藏
- 关注
原创 协同过滤--基于用户推荐
基于用户的推荐算法的应用场景,UserCF比较合适用户较多,但是物品较有限,对于本数据集就是电影的情况下比较实用,如果物品种类较多或说物品种类远大于用户情况下,则基于物品的推荐算法ItemCF更为实用,这个后续再介绍。
2023-05-08 22:51:22 324 1
原创 机器学习流程——监督学习篇
无论是分类任务还是回归任务,毫无疑问他们都属于机器学习中的监督学习,因为他们都含有标签,但是只要他们是机器学习任务我们都可以将他们分为7步走,数据准备->提取特征和标签->划分训练集和测试集->模型选择->训练->预测->评估,如果有需要后面也会有调参和模型保存两步骤,以上就是我对监督学习流程的总结,希望对大家有所帮助。
2022-11-04 23:26:09 677
原创 飞桨高层API实现手写数字识别任务
手写数字识别的问题定义比较简单,这里不过多描述。paddle是paddle框架的核心包,里面内置了许多高效的API。这里使用的 paddle.vision.transforms便是其一,它主要用于对我们的数据进行预处理。
2022-10-23 21:08:56 1023
原创 Pandas库介绍和Series对象基本操作
pandas是一个基于numpy、专门为数据分析而设计的库,它提供了Series和DataFrame两种数据结构,分别用于处理一维和二维的数据。
2022-09-11 11:45:24 434
原创 数据预处理概述和开发工具
数据预处理是数据分析或数据挖掘前的准备工作,也是数据分析或数据挖掘中必不可缺少的一环,它主要通过一系列的方法来处理“脏”数据、精确地抽取数据、调整数据的格式,从而得到一组符合准确、完整、简洁等标准的高质量数据,保证该数据能更好地服务于数据分析工作或数据挖掘工作。
2022-09-07 19:51:36 2110
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人