数据分析
xiu_cs
所有博客仅作为个人笔记用,内容写的乱七八糟,不要参考
Do what you want to do.
展开
-
可视化视图
散点图示例代码:import numpy as npimport pandas as pdimport matplotlib.pyplot as pltimport seaborn as sns# 数据准备N = 1000x = np.random.randn(N)#随机生成N个点y = np.random.randn(N)# 用Seaborn画散点图df = pd.Data...原创 2020-02-11 16:07:34 · 1349 阅读 · 0 评论 -
Pandas核心数据结构:Series和 DataFrame
Series Series是一个定长的字典序列,有两个基本属性,分别是index和values。index默认是从0开始的递增整数序列,e.g. 0,1,2,3, 4。也可以自己指定索引,如index=[‘a’, ‘b’, ‘c’, ‘d’]。示例代码:import pandas as pdfrom pandas import Series, DataFramex1 = Series(...原创 2020-02-11 11:47:06 · 606 阅读 · 0 评论 -
数据规范化处理
常用的三种数据规范化处理方法: 常用的数据规范化处理主要有Min-max规范化、Z-Score规范化和小数定标规范化。下面简要介绍下三种数据规范化方法,并用python的机器学习库SciKit-Learn来实现数据变化。Min-max 规范化 Min-max 规范化方法是将原始数据变换到[0,1]的空间中用公式表示就是:新数值 =(原数值 - 极小值)/(极大值 - 极小值)。运行代...原创 2020-02-11 07:11:40 · 7143 阅读 · 0 评论