自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(3)
  • 收藏
  • 关注

原创 数据科学导论——K均值

第一关 k的均值小试Python 机器学习库 Scikit-learn 基础知识 Python最流行的 ML&DM 库,使用广泛; 广泛用于回归分析、分类、聚类等机器学习任务,本小节主要介绍分类基础用法; 最新版本 ——v0.21.3,2019 年 7 月,后续将持续更新。 如何使用 KMeans 函数以及变种的 MiniBatchKMeans 函数完成程序编写首先应该引入 sklearn 库或者直接引入需要的函数,在合适的位置调用函数,以实现所需要的功能。..

2022-04-20 19:48:32 2037 1

原创 数据科学科学导论——数据预处理

第一关 数据清理——查漏补缺数据清理所需要掌握的知识点:1.numpy库2.pandas库3.sklearn库为什么要清理数据?因为任何一组大量的数据之中,肯定存在空缺值、噪声数据,而数据清理的重点就是将这两种数据全部给清楚掉。空缺值在大多数时候数据并不总是完整的,例如:数据库表中,很多条记录的对应字段没有相应值,比如销售表中的顾客收入。而引起空值的原因有很多: 设备异常; 与其他已有数据不一致而被删除; 因为误解而没有被输入的数据; 在输

2022-04-20 19:39:27 3065

原创 educoder实训平台-----数据科学导论—数学基础之优化

数据科学导论—数据采集实战第一关单网页爬取任务描述本关任务:编写一个爬虫,爬取 www.jd.com 网的 title。相关知识为了完成本关任务,需要具备几个基本的技能。首先需要对 Python 语言具有一定的掌握。了解其中的 Urllib 库, Re 库, Random 库。其中,Urllib 库主要实现对网页的爬取。Re 库实现数据的正则化表达。Random 库实现数据的随机生成。网络爬虫是一种按照一定规则自动抓取互联网信息的程序或者脚本。爬虫的行为过程可以划分为三个部分:.

2022-04-19 20:28:34 283

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除