数据分析与可视化基础、实例
楼上little黑
我要不写点东西,他就说我偷懒,没写签名
展开
-
matplotlib·1(散点图,曲线图,注释添加,图像保存,区域分割,中文使用)
import matplotlib.pyplot as pltx=list(range(0,100))y=[pow(i,2) for i in x]z=[2.5*i for i in x]m=[4*i for i in x]n=[10*i for i in x]#坐标轴长度设置(放在前面用于全局)plt.axis([0,100,0,800])#分割子区域plt.subpl...原创 2019-05-26 14:21:54 · 2329 阅读 · 0 评论 -
pandas2·——>DataFrame2·(排序、统计函数、相关性)
排序NaN统一放到排序末尾.sort_index()方法在指定轴上根据索引进行排序,默认升序.sort_index(axis=0, ascending=True).sort_values()方法在指定轴上根据数值进行排序,默认升序Series.sort_values(axis=0, ascending=True)DataFrame.sort_values(by, axis=0, a...原创 2019-09-08 16:15:18 · 742 阅读 · 0 评论 -
pandas2·——>DataFrame(创建、索引、运算)
DataFrame类型由共用相同索引的一组列组成DataFrame是一个表格型的数据类型,每列值类型可以不同DataFrame既有行索引、也有列索引DataFrame常用于表达二维数据,但可以表达多维数据DataFrame是二维带“标签”数组创建:• 二维ndarray对象• 由一维ndarray、列表、字典、元组或Series构成的字典• Series类型• 其他的D...原创 2019-09-08 15:08:07 · 768 阅读 · 0 评论 -
pandas1·——>Series(创建、索引、部分展示、去除空数据)
Series是一维带“标签”数组index_0 data_aSeries基本操作类似ndarray和字典,根据索引对齐Series类型的创建由一组数据及与之相关的数据索引组成可使用(1·Python列表 2·标量值 3·Python字典 4·ndarray 5·其他函数)五类方法创建• Python列表,index与列表元素个数一致• 标量值,index表达Series类型的尺寸...原创 2019-09-08 10:42:59 · 1819 阅读 · 0 评论 -
实例6·图像转换,颠倒(图片的构成,jpg、png的不同)
图像是一个三维数组,维度分别是高度、宽度和像素RGB值import numpy as npfrom PIL import Imagea=np.array(Image.open("C:\\Users/Administrator/Desktop/mn.jpg").convert("L"))b=255-aim=Image.fromarray(b.astype("uint8"))im.sa...原创 2019-08-22 09:31:45 · 1055 阅读 · 0 评论 -
Nunmpy2·(数据的存取、运算、random的随机函数、统计函数、梯度函数)
·存取csv文件(一维,二维)存np.savetxt(frame, array, fmt='%.18e', delimiter=None)• frame : 文件、字符串或产生器,可以是.gz或.bz2的压缩文件• array : 存入文件的数组• fmt : 写入文件的格式,例如:%d %.2f %.18e• delimiter : 分割字符串,默认是任何空格...原创 2019-08-22 09:04:10 · 285 阅读 · 0 评论 -
Numpy1·(数组的生成、判断、转换、索引(取出符合条件的数值)、切片)
#导入import numpy as np数组生成1·直接生成 使用字典,列表,元组及其嵌套'''p91 数组生成函数'''a=np.array([1,2,3,4],dtype=np.float64) #可以指定类型,也可以不指定,不指定就生成给定的数据b=np.array([[1,2,3,4],[5,6,7,8]])数组判断大小np.size(b)--------...原创 2019-08-20 20:48:12 · 1700 阅读 · 0 评论 -
实例5·GitHub-Api数据绘制(链接添加,api调用,颜色填充)
import requestsimport pygalfrom pygal.style import LightColorizedStyle as LCS, LightenStyle as LS# 获取信息url = 'https://api.github.com/search/repositories?q=language:python&sort=stars'r = req...原创 2019-05-27 20:13:36 · 182 阅读 · 0 评论 -
实例4·股票数据分析(pygal,json格式数据处理)
import jsonimport requestsimport pygalimport mathfrom itertools import groupby# 将数据加载到一个列表中filename = 'C://Users/Administrator/Desktop/btc_close_2017.json'with open(filename) as f: texts ...原创 2019-05-27 12:32:17 · 990 阅读 · 2 评论 -
实例3·加州死亡谷温度曲线(csv文件处理,图例字体倾斜)
import csvfrom datetime import datetimefrom matplotlib import pyplot as pltwith open('C://Users/Administrator/Desktop/death_valley_2014.csv') as f: text = csv.reader(f) #表头 header_ro...原创 2019-05-26 20:46:36 · 785 阅读 · 0 评论 -
实例2·筛子直方图(pygal下的直方图绘制,svg格式的打开)
# 创建一个筛子类import pygalfrom random import randintclass Shaizi(): def __init__(self, sides_num=6): self.sides_num = sides_num def number(self): return randint(1, 6)# 掷骰子...原创 2019-05-26 19:50:03 · 264 阅读 · 0 评论 -
实例1·随机漫步图(matplotlib下的设置图像尺寸,隐藏坐标轴)
from random import choiceimport matplotlib.pyplot as pltx_start = [0]y_start = [0]#生成坐标矩阵while len(x_start)<10000: x_direction=choice([-1,1]) x_distance=choice([0,1,2,3,4]) x_s...原创 2019-05-26 19:20:22 · 1290 阅读 · 0 评论 -
matplotlib·2(绘制饼图,直方图,极坐标图,复杂子区域分割)
import numpy as npimport matplotlib.pyplot as plt# 绘制饼图labels = 'x', 'y', 'z', 'm' # 坐标轴名称size = [100, 230, 340, 343]explode = (0, 0.1, 0, 0) # 使得y的数据突出plt.subplot2grid((3, 3), (0, 0), colsp...原创 2019-05-26 16:02:24 · 804 阅读 · 0 评论 -
苹果股票数据分析(object数据的转换,行索引的转换)
导入数据分析三剑客import numpy as npimport pandas as pdimport matplotlib.pyplot as pltapple=pd.read_csv("C://Users/Administrator/Desktop/apple.csv")#a=apple.dtypes'''Date objectOpen ...原创 2019-09-09 21:48:25 · 709 阅读 · 0 评论