![](https://img-blog.csdnimg.cn/20201014180756925.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
Python数据分析
numpy,pandas,.matplotlib
ZhengJohn
这个作者很懒,什么都没留下…
展开
-
pandas处理列中的数据,去除美元符号
今天开始数据挖掘短租房屋的建模过程,其中有一个excel数据表中的价格为字符串类型,需要转化为数值才能进行后续的数据挖掘。在网上寻找了很久的解答过程,终于解决了如下的问题。inputcalender = '../SrcData/calendar_detail.csv'outputcalender = '../NewData/calendar_detail.xlsx'data = p...原创 2020-03-19 00:42:34 · 4905 阅读 · 0 评论 -
Scrapy 抓取 当当图书2018畅销榜的所有图书
学习了Scrapy来爬取数据,来实践来爬取当当图书的畅销榜的图书。1.创建工程# 创建工程scrapy startporject dangdang# 创建爬虫cd dangdang 进入dangdang这个工程里面# 创建dangdang_book的爬虫, 开始的网址为dangdang.comscrapy genspider dangdang_book "dangd...原创 2020-03-09 20:19:34 · 555 阅读 · 0 评论 -
Python数据分析三大框架之matplotlib(八)subplot绘制多个子图
使用subplot绘制多个子图import matplotlib.pyplot as pltimport numpy as np# 创建一个figureplt.figure()# 设置为2 * 2 的图 1 为(1,1)的子图plt.subplot(2, 2, 1)a = np.arange(512)b = a**2plt.plot(a, b)plt.xticks([-...原创 2020-03-02 13:02:20 · 457 阅读 · 0 评论 -
Python数据分析三大框架之matplotlib(七)scatter散点图绘制
scatter散点图绘制import matplotlib.pyplot as pltimport numpy as npn = 512X = np.random.uniform(-1.5, 1.5, n) # 服从(-1.5, 1.5)的正态分布Y = np.random.uniform(-1.5, 1.5, n) # 服从(-1.5, 1.5)的正态分布T = np.arct...原创 2020-03-02 12:51:10 · 138 阅读 · 0 评论 -
Python数据分析三大框架之matplotlib(六)axis, ticks坐标轴设置
axis,ticks为图像的坐标的设置,有以下为其中几种设置的方法。import matplotlib.pyplot as pltimport numpy as npx = np.linspace(-3, 3, 50)y1 = 2*x + 1y2 = x**2plt.figure()plt.plot(x, y2)plt.plot(x, y1, color='red', li...原创 2020-03-02 12:41:02 · 2149 阅读 · 2 评论 -
Python数据分析三大框架之matplotlib(五)figure
Figure相当于一个session,也就是说在这个Figure下这张图片可以进行很多图像的绘制。import matplotlib.pyplot as pltimport numpy as npx = np.linspace(-3, 3, 50)y1 = 2*x + 1y2 = x**2# 一个figure下面可以画出一个或多个图,相当于sessionplt.figure(...原创 2020-03-02 12:34:21 · 157 阅读 · 0 评论 -
Python数据分析三大框架之matplotlib(四)等高线图绘制
等高线图绘制import matplotlib.pyplot as pltimport numpy as npdef f(x, y): #The height function return (1 - x/2 + x**5 + y**3) * np.exp(-x**2-y**2)n = 256x = np.linspace(-3, 3, n)y = np.lin...原创 2020-03-02 12:30:28 · 361 阅读 · 0 评论 -
Python数据分析三大框架之matplotlib(三)3D图像绘制
3D图像的绘制import matplotlib.pyplot as pltimport numpy as npfrom mpl_toolkits.mplot3d import Axes3Dfig = plt.figure()ax = Axes3D(fig)# X, Y valueX = np.arange(-4, 4, 0.25)Y = np.arange(-4, 4, ...原创 2020-03-02 12:29:19 · 210 阅读 · 0 评论 -
Python数据分析三大框架之matplotlib(二)条形图的绘制
条形图的绘制import matplotlib.pyplot as pltimport numpy as npn = 12X = np.arange(n)Y1 = (1-X/float(n))*np.random.uniform(0.5, 1.0, n)Y2 = (1-X/float(n))*np.random.uniform(0.5, 1.0, n)#条形图的绘制plt...原创 2020-03-02 12:25:52 · 148 阅读 · 0 评论 -
Python数据分析三大框架之matplotlib(一)基本画图过程
前段时间学习了如何使用matplotlib绘制基本的数据图像import matplotlib.pyplot as pltimport numpy as npx = np.linspace(-1, 1, 100)#y = 2*x + 1y = x**2 + 1plt.plot(x, y)plt.show()使用plt.plot(x, y)绘制图像然后plt.show()...原创 2020-03-02 12:21:11 · 243 阅读 · 0 评论 -
Python数据分析三大框架之pandas(五)值的设置
值的设置import pandas as pdimport numpy as npdates = pd.date_range('20130101', periods= 6)df = pd.DataFrame(np.arange(24).reshape(6, 4), index = dates, columns = ['A', 'B', 'C', '...原创 2020-03-01 22:21:44 · 126 阅读 · 0 评论 -
Python数据分析三大框架之pandas(四)concat合并
concat合并import numpy as npimport pandas as pd# concatenatingdf1 = pd.DataFrame(np.ones((3, 4))*0, columns= ['a', 'b', 'c', 'd'])df2 = pd.DataFrame(np.ones((3, 4))*1, columns= ['a', 'b', 'c'...原创 2020-03-01 22:19:48 · 166 阅读 · 0 评论 -
Python数据分析三大框架之pandas(三)merge合并
合并部分 基础的部分 import numpy as npimport pandas as pd# merging two df by key/keys. (may be used in database)# simple exampleleft = pd.DataFrame({'key':['K0', 'K1', 'K2', 'K3'], ...原创 2020-03-01 22:16:20 · 305 阅读 · 0 评论 -
Python数据分析三大框架之pandas(二)打印输出,标签选择
打印输出import pandas as pdimport numpy as npdates = pd.date_range('20160101', periods= 6) # 时间序列df = pd.DataFrame(np.arange(24).reshape(6, 4), index = dates, columns = ['A', '...原创 2020-03-01 22:07:33 · 711 阅读 · 0 评论 -
Python数据分析三大框架之 pandas (一)基本数据形式
开始学习了pandas的基本操作与基本数据形式。 基本的序列 import pandas as pdimport numpy as np# 基本的序列s = pd.Series([1, 3, 6, np.nan, 44, 1], index=[1, 2, 3 ,4, 5, 6])print(s)#result1 1.02 3.03 6...原创 2020-03-01 21:57:49 · 374 阅读 · 0 评论 -
Python数据分析三大框架之numpy (五)合并
numpy数组的合并 按行合并 import numpy as npA = np.array([1, 1, 1])B = np.array([2, 2, 2])print(np.vstack((A, B)))# 按行合并C = np.vstack((A, B))print(A.shape, B.shape, C.shape)#result[[1 1 1]...原创 2020-03-01 21:31:26 · 93 阅读 · 0 评论 -
Python数据分析三大框架之 numpy (四)最大值,平均值
在这里学习了数组的平均值,最大值,累加值。 最大值,最小值的索引 import numpy as npA = np.arange(2, 14).reshape(3, 4)# 最小值的索引print(np.argmin(A))# 最大值的索引print(np.argmax(A)) 求平均值的方法 # 平均值的三种方法print(np.mea...原创 2020-03-01 21:23:02 · 827 阅读 · 0 评论 -
Python数据分析三大框架之 numpy (三)计算
学习了numpy里面的数组计算 数组减法 import numpy as npa = np.array([10, 20, 30, 40])b = np.arange(4) # [0, 1, 2, 3]# 减法result1 = a - bprint(a, b)result1 = a - b # [10-0, 20-1, 30-2, 40-3]print(res...原创 2020-03-01 20:59:17 · 182 阅读 · 0 评论 -
Python数据分析三大框架之numpy (二)分割
前段时间学习了分割数组的几种方法 按列分割 axis = 1 import numpy as npA = np.arange(12).reshape((3, 4))print(A)# 按列分割成两块 按列分割 axis = 1print(np.split(A, 2, axis= 1))# 按行分割成三块print(np.vsplit(A, 3))#re...原创 2020-03-01 20:36:58 · 286 阅读 · 0 评论 -
Python数据分析三大框架之 numpy (一)数组
学习数据分析的三大入门框架之一的numpy,整理以下学习的知识点。数组部分 数组类型 # array's data type (int float double ....) 数组类型a = np.array([2,23,4],dtype = np.float)print(a)# print array data typeprint(a.dtype)...原创 2020-03-01 20:21:28 · 251 阅读 · 0 评论