我与月亮肩并肩-CSDN博客

原创数据科学导论——K均值

第一关 k的均值小试Python 机器学习库 Scikit-learn 基础知识 Python最流行的 ML&DM 库，使用广泛；广泛用于回归分析、分类、聚类等机器学习任务，本小节主要介绍分类基础用法；最新版本 ——v0.21.3，2019 年 7 月，后续将持续更新。如何使用 KMeans 函数以及变种的 MiniBatchKMeans 函数完成程序编写首先应该引入 sklearn 库或者直接引入需要的函数，在合适的位置调用函数，以实现所需要的功能。..

2022-04-20 19:48:32 2148 1

原创数据科学科学导论——数据预处理

第一关数据清理——查漏补缺数据清理所需要掌握的知识点：1.numpy库2.pandas库3.sklearn库为什么要清理数据？因为任何一组大量的数据之中，肯定存在空缺值、噪声数据，而数据清理的重点就是将这两种数据全部给清楚掉。空缺值在大多数时候数据并不总是完整的，例如：数据库表中，很多条记录的对应字段没有相应值，比如销售表中的顾客收入。而引起空值的原因有很多：设备异常；与其他已有数据不一致而被删除；因为误解而没有被输入的数据；在输

2022-04-20 19:39:27 3250

原创 educoder实训平台-----数据科学导论—数学基础之优化

数据科学导论—数据采集实战第一关单网页爬取任务描述本关任务：编写一个爬虫，爬取 www.jd.com 网的 title。相关知识为了完成本关任务，需要具备几个基本的技能。首先需要对 Python 语言具有一定的掌握。了解其中的 Urllib 库， Re 库， Random 库。其中，Urllib 库主要实现对网页的爬取。Re 库实现数据的正则化表达。Random 库实现数据的随机生成。网络爬虫是一种按照一定规则自动抓取互联网信息的程序或者脚本。爬虫的行为过程可以划分为三个部分：.

2022-04-19 20:28:34 301

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

原创 数据科学导论——K均值

原创 数据科学科学导论——数据预处理

原创 educoder实训平台-----数据科学导论—数学基础之优化

空空如也

空空如也

原创数据科学导论——K均值

原创数据科学科学导论——数据预处理