数据挖掘基础知识与比赛的了解 task1

task2

怀着紧张的心情开启了自己第一次关于数据方面的比赛之旅,有挑战,也有期待。

关于赛题

  1. 理解赛题
  2. 对赛题背景要了解,不要一拿到赛题就拿代码,拿数据去跑;
  3. 数据中会有很多异常值,我们要对错误值、缺失值等等进行数据清洗;
  4. 比赛分类通常为三种,分类问题,回归问题,其他问题,本次比赛的二手车交易是一个回归问题,用已有之前的数据进行回归分析来预测以后的二手车的价格等等;
  5. 泛化能力要强,做出的模型要对学习集以外的一些数据能做出更好的预测;
  6. 赛题的数据
    • Field–Description表示标签与其对应的描述,
    • 数据分为定类变量,定序变量,定距变量。分别表示 :名义上的,不能用数目或程度表示,如性别;有分类,排序,但差无意义,如消费水平;有分量,有排序,且差有意义,如身高体重。
  7. 比赛的评判标准,有 R^2,MAE平均觉得误差,MSE均方误差

Baseline

  1. 数据科学库:pandas,numpy,scipy
  2. 数据可视化:matplotlib,seabon
  3. xgb,lbg等算法是模型建造的重点

这些都是以后需要找时间细细学习的地方

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
回答: 数据库是指用于存储和管理大量数据的软件系统,常见的数据库软件或DBMS包括MySQL、Microsoft Access、Microsoft SQL Server、FileMaker Pro、Oracle Database和dBASE等。\[1\]数据库可以结构化存储大量的数据信息,方便用户进行有效的检索和访问。它可以对数据进行分类保存,并且能够提供快速的查询。例如,我们平时使用百度搜索内容时,百度也是基于数据库和数据分类技术来达到快速搜索的目的。\[3\]此外,数据库还可以根据不同的需求和角度进行不同的划分,比如概念数据库可以通过外模式和内模式的映射与物理数据库相连接,实现数据的管理和操作。\[2\] #### 引用[.reference_title] - *1* *3* [SQL Server数据库基础知识汇总](https://blog.csdn.net/qq_39847278/article/details/127338601)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^insert_down1,239^v3^insert_chatgpt"}} ] [.reference_item] - *2* [数据库基础知识,超全!!!](https://blog.csdn.net/weixin_46486131/article/details/120374927)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^insert_down1,239^v3^insert_chatgpt"}} ] [.reference_item] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值