自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(9)
  • 收藏
  • 关注

原创 阿里云天池python三数之和 (超简单方法)

给你一个包含 n 个整数的数组 nums,判断 nums 中是否存在三个元素 a,b,c ,使得 a + b + c = 0?请你找出所有和为 0 且不重复的三元组。

2023-02-10 15:46:08 118

原创 Python数据分析之特征处理笔记六——特征预处理(案例分析)

阅读了前面文章的小伙伴们有没有对特征预处理有了一定的了解呢?接下来这篇文章将通过一个分析实践项目进一步了解特征预处理的过程。

2022-10-16 21:37:28 1142 3

原创 Python爬虫实践项目——15名王者英雄皮肤信息提取

最近在学习利用Python编写爬虫代码爬取网页数据,但学习内容主要是针对于窗口不变或者网页地址不变的网页信息提取。于是我在日常学习的基础上,做了一个针对于新增窗口页面数据提取的项目。

2022-10-13 22:59:22 1056

原创 Python数据分析之特征处理笔记五——特征预处理(特征降维及特征衍生)

书接上文,本次将介绍两种常用的特征降维的方法:主成分分析(Principal Component Analysis,PCA),线性判别分析(Linear Discriminant Analysis,LDA)。

2022-10-05 21:10:27 732

原创 Python数据分析之特征处理笔记四——特征预处理(特征变换)

特征变换核心思想:将一组特征转换成可用数字表示、形式统一并且包含较可能多原始信息的新特征。一般包括对指化、离散化、归一化、数值化、正规化(规范化)等方法。

2022-10-04 20:25:03 2468

原创 Python数据分析之特征处理笔记三——特征预处理(特征选择)

书接上文,进行数据清洗过程后,我们得到了没有空值、异常值、错误值的数据,但想要用海量的数据来建立我们所需要的算法模型,仅仅是数据清洗的过程是不够的,因为有的数据类型是数值,有的是字符,怎样将不同类型的数据联系起来?以及在保证最大化信息量的前提下,怎样得到便于分析的数据?这就是特征预处理要做的工作。

2022-10-03 16:19:24 5284 1

原创 Python数据分析之特征处理笔记二——数据清洗

书接上文参考百度百科数据清洗的介绍。本篇介绍数据清洗的基本概念、原理及常用的清洗方法,并附有相应的代码以作参考。

2022-10-01 17:09:25 766

原创 Python数据分析之特征处理笔记一——总体介绍

数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限而已。

2022-09-30 16:53:39 281

原创 各省市经济情况分析——基于SAS软件

我们通过分析各省份的社会经济的12项统计指标来研究各省份的经济运行状况。根据CSMAR数据库历年对各省份的统计资料,我们提取1200条以上有关数据进行汇总,汇总数据见附录1。为了研究各省份的经济情况,我们将采用描述性统计、主成分分析、因子分析等方法进行多角度、全方面的分析。

2022-06-02 17:17:46 1893

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除