
数据分析
数据分析相关博客
白水baishui
天光乍破
-
原创 科学计算库Numpy-数据结构
假定所有操作都事先导入numpy库import numpy1、查询文档 在运用numpy库的时候遇到不知道使用的函数可以查询官方文档来学习,例如查询genfromtxt()函数的文档print(help(numpy.genfromtxt))2、创建向量(数组)和矩阵 ①创建一个向量vector = numpy.array([5, 10, 15, 20])pri...2017-10-15 15:31:21565
0
-
原创 可视化库Matplotlib-柱形图与盒图
导入numpy库、pandas库和Matplotlib库import pandas as pdimport numpyimport matplotlib.pyplot as plt导入文件reviews = pd.read_csv("fandango_score_comparison.csv")柱形图 生成一个柱形图:#bist图(柱形图)fig, ax ...2018-01-09 12:28:122296
0
-
原创 可视化库Matplotlib-条形图与散点图
导入numpy库、pandas库和Matplotlib库import pandas as pdimport numpyimport matplotlib.pyplot as plt导入文件reviews = pd.read_csv("fandango_score_comparison.csv")条形图: 生成一个条形图:cols = ['Metacritic...2018-01-09 11:16:35826
0
-
原创 可视化库Matplotlib-子图
导入numpy库、pandas库和Matplotlib库import numpy as npimport pandas as pdimport matplotlib.pyplot as plt1、将画板分为几个子图#创建一个画板fig = plt.figure()#创建子图,参数n、m、k分别表示把画板分为n×m块子画板,子图在k子画板上ax1 = fig.add_s...2017-11-18 18:45:32541
1
-
原创 可视化库Matplotlib-折线统计图
首先导入pandas库和matplotlib库import pandas as pdimport matplotlib.pyplot as plt以一个csv文件来演示用Matplotlib制作折线统计图:UNRATE.csv导入csv文件unrate = pd.read_csv("UNRATE.csv")把参数‘DATE’转化为标准时间格式unrate['D...2017-11-18 12:14:321335
2
-
原创 数据分析处理库Pandas-Series结构
Series是DataFrame的一个子结构,把DataFrame中的某一列或者某几列单独拿出来就是一个Series结构,相当于Numpy当中ndarray导入pandas库import pandas as pd我们以一个csv文件来演示Series的作用:fandango_score_comparison.csv导入csv文件fandango_score_comparisio...2017-11-17 20:16:18849
0
-
原创 数据分析处理库Pandas-常用函数
导入pandas库和numpy库import pandas as pdimport numpy as np我们以一个csv文件来展示pandas是如何来进行数据预处理的:titanic_train.csv读入文件titanic_train.csvtitanic_survival = pd.read_csv("titanic_train.csv")1、求平均值 ①通过...2017-11-15 16:27:402210
0
-
原创 数据分析处理库Pandas-数据预处理
导入pandas库和numpy库import pandas as pdimport numpy as np我们以一个csv文件来展示pandas是如何来进行数据预处理的:titanic_train.csv读入文件titanic_train.csv,并显示前十行数据titanic_survival = pd.read_csv("titanic_train.csv")tit...2017-11-10 18:13:161216
0
-
原创 数据分析处理库Pandas-数据读取
假定所有操作都事先导入pandasimport pandas我们以一个csv文件为例,来展示pandas是如何读取数据的:food_info 读入csv文件food_info = pandas.read_csv("food_info.csv")1、查看pandas的数据结构,pandas的数据结构为DataFrame类型print(type(food_info))...2017-11-09 17:43:132075
1
-
原创 科学计算库Numpy-常用函数
假定所有操作都事先导入numpy库import numpy as np1、平方根和次方根B = np.array([0, 1, 2])print(B)print('----------')#计算e的次方print(np.exp(B))print('----------')#计算次方根print(np.sqrt(B))结果为:[0 1 2]------...2017-11-04 22:30:061434
0
-
原创 科学计算库Numpy-矩阵操作
假定所有操作都事先导入numpy库import numpy as np1、构造矩阵 ①构造一个零阵np.zeros((3,4))#构造的零阵其中的值默认为folat类型结果为:array([[ 0., 0., 0., 0.], [ 0., 0., 0., 0.], [ 0., 0., 0., 0.]])②构造一个...2017-11-04 16:35:12473
0
-
原创 科学计算库Numpy-矩阵属性
假定所有操作都事先导入numpy库import numpy as np1、造一个索引(从0开始的排列)print(np.arange(15))结果为:[ 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14]2、将向量转化为矩阵a = np.arange(15).reshape(3,5)a结果为:array([[ ...2017-11-04 08:21:44374
0
-
原创 科学计算库Numpy-数据操作
假定所有操作都事先导入numpy库import numpy1、判断向量或矩阵中是否存在某一元素①向量vector = numpy.array([5, 10, 15, 20])vector == 10结果为:array([False, True, False, False], dtype=bool)②矩阵matrix = numpy.array([[5, ...2017-10-18 16:50:12428
0
-
原创 可视化库Seaborn-整体布局风格
导入库import seaborn as snsimport numpyimport pandas as pdimport matplotlib.pyplot as plt%matplotlib inline写一个sinsin\sin函数并用Matplotlib表示出来def sinplot(flip = 1): x = numpy.linspace(0, 14...2018-01-09 16:52:261239
3