python数据科学
向前走别回头
在读学生一枚。
展开
-
Pandas入门系列(一)-- Series
Series的创建##数据分析汇总学习https://blog.csdn.net/weixin_39778570/article/details/81157884# 使用列表创建>>> import numpy as np>>> import pandas as pd>>> s1 = pd.Series([1,2,3,4]...原创 2018-06-02 18:33:51 · 9174 阅读 · 0 评论 -
Pandas玩转数据(十二) -- 数据聚合技术Aggregation
import pandas as pdimport numpy as npfrom pandas import Series, DataFrame# 打开csv文件f = open('city_weather.csv')df = pd.read_csv(f)dfOut[12]: date city temperature wind0 03/01/20...原创 2018-07-19 16:47:18 · 3574 阅读 · 1 评论 -
Pandas玩转数据(十三) -- 透视表
import pandas as pdimport numpy as npfrom pandas import Series, DataFramexlsx = pd.ExcelFile('D:\\imooc Python3数据科学入门与实战\\homework\\sales-funnel.xlsx')df = pd.read_excel(xlsx)# 生成透视表# aggfunc默认...原创 2018-07-19 17:28:17 · 3379 阅读 · 5 评论 -
Pandas玩转数据(十四) -- 分组和透视功能实战
import pandas as pdimport numpy as npfrom pandas import Series, DataFrame# 打开美国航空公司数据f = open('D:\\imooc Python3数据科学入门与实战\\homework\\usa_flights.csv')df = pd.read_csv(f)df.head()Out[6]: ...原创 2018-07-19 23:39:17 · 2512 阅读 · 3 评论 -
Matplotlib简单画图(一) -- plot
import pandas as pdimport numpy as npfrom pandas import Seri```es, DataFrameimport matplotlib.pyplot as plta = [1,2,3]# 传入a为x轴,y轴默认plt.plot(a)[<matplotlib.lines.Line2D at 0x1258dde4128>]...原创 2018-07-20 19:40:01 · 4187 阅读 · 0 评论 -
Matplotlib简单画图(二) -- subplot
# 导入库import pandas as pdimport numpy as npfrom pandas import Series, DataFrameimport matplotlib.pyplot as plt# 等差数列50个值x = np.linspace(0.0, 5.0)# 生成两个y轴坐标y1 = np.sin(np.pi*x)y2 = np.sin(np...原创 2018-07-20 21:00:27 · 7667 阅读 · 3 评论 -
Matplotlib简单画图(三) -- pandas绘图之Series
import pandas as pdimport numpy as npfrom pandas import Series, DataFrameimport matplotlib.pyplot as plt%matplotlib inline# cumsum()函数演示s = Series([1,2,3,4,5])s.cumsum()0 11 32 ...原创 2018-07-20 23:37:57 · 8114 阅读 · 0 评论 -
Matplotlib简单画图(四) -- pandas绘图之DataFrame
import numpy as npimport matplotlib.pyplot as pltfrom pandas import Series, DataFrame# 创建一个10行4列的DataFramedf = DataFrame( np.random.randint(1,10,40).reshape(10,4), columns = {'A','B','C...原创 2018-07-21 13:25:02 · 30120 阅读 · 0 评论 -
Matplotlib简单画图(五) -- 直方图和密度图
import numpy as npimport pandas as pdimport matplotlib.pyplot as pltfrom pandas import Series, DataFrames = Series(np.random.randn(1000))# 生成了两个array和一个图形对象,第一个array是在区间数的数量,第二个是区间范围# hist画直方...原创 2018-07-21 15:07:11 · 21693 阅读 · 0 评论 -
Seaborn简单画图(一) -- 散点图
import pandas as pdimport numpy as npfrom pandas import Series, DataFrameimport matplotlib.pyplot as pltimport seaborn as sns%matplotlib inline# 打开一个花瓣长宽数据文件f = open('iris.csv')iris = pd.re...原创 2018-07-21 16:02:43 · 13286 阅读 · 0 评论 -
Seaborn简单画图(二) -- 直方图和密度图
import numpy as npimport pandas as pdimport matplotlib.pyplot as pltfrom pandas import Series, DataFrame%matplotlib inlineimport seaborn as sns# 使用matplotlibs1 = Series(np.random.randn(1000)...原创 2018-07-21 16:13:02 · 7686 阅读 · 0 评论 -
Seaborn简单画图(三) -- 柱状图和热力图
import numpy as npimport pandas as pdimport matplotlib.pyplot as pltfrom pandas import Series, DataFrame%matplotlib inlineimport seaborn as sns数据在这里复制,sns.load_dataset(‘flights’) https://githu...原创 2018-07-21 16:47:47 · 13941 阅读 · 3 评论 -
Seaborn简单画图(四) -- 设置图形显示效果
import numpy as npimport pandas as pdimport matplotlib.pyplot as plt%matplotlib inlinex = np.linspace(0,14,100)y1 = np.sin(x)y2 = np.sin(x+2)*1.25def sinplot(): plt.plot(x,y1) plt.pl...原创 2018-07-21 17:22:39 · 8527 阅读 · 0 评论 -
Seaborn简单画图(五) -- Seaborn调色功能
官方参考文档: http://seaborn.pydata.org/tutorial/color_palettes.htmlimport numpy as npimport pandas as pdimport matplotlib.pyplot as plt%matplotlib inline# 绘图,figsize设置大小def sinplot(): x = ...原创 2018-07-21 17:57:00 · 8108 阅读 · 2 评论 -
股票市场分析实战
导入相关函数库import pandas as pdimport numpy as npfrom pandas import Series, DataFrameimport matplotlib.pyplot as plt%matplotlib inlinefrom datetime import datetimeimport seaborn as snssns.set()从...原创 2018-07-22 18:15:52 · 8096 阅读 · 2 评论 -
python数据分析
python绘图、python数据分析、python库、股票分析原创 2018-07-22 19:43:44 · 59192 阅读 · 41 评论 -
Numpy教程
前言参见:What is NumpyNumpy是Python科学计算的基本包,它提供一个多维数组对象及各种派生对象(如屏蔽的数组和矩阵)以及一系列用于数组快速操作的例程,包括数学、逻辑、形状操作、排序、选择、I/O,离散傅里叶变换、线性代数、基本统计操作、随机模拟等等。Numpy融合了C...转载 2018-08-04 10:27:15 · 2617 阅读 · 0 评论 -
Pandas玩转数据(十一) -- 数据分组技术Groupby
import numpy as npimport pandas as pdfrom pandas import Series, DataFrame# 打开文件f = open('city_weather.csv')df = pd.read_csv(f)dfOut[7]: date city temperature wind0 03/01/2016 ...原创 2018-07-19 16:24:05 · 2795 阅读 · 0 评论 -
Pandas玩转数据(十) -- 数据分箱技术Binning
import pandas as pdimport numpy as npfrom pandas import Series, DataFrame# 随机生成一段成绩score_list = np.random.randint(25, 100, size=20)score_listOut[5]: array([53, 67, 36, 37, 30, 63, 83, 83, 54,...原创 2018-07-19 16:03:16 · 12085 阅读 · 3 评论 -
Pandas玩转数据(九) -- 时间序列的采样和画图
import numpy as npimport pandas as pdfrom pandas import Series, DataFrame# 生成一个时间序列t_range = pd.date_range('2016-01-01', '2016-12-31')t_rangeOut[5]: DatetimeIndex(['2016-01-01', '2016-01-02', ...原创 2018-07-19 15:37:25 · 5926 阅读 · 0 评论 -
Pandas入门系列(二)-- DataFrame
数据分析汇总学习 https://blog.csdn.net/weixin_39778570/article/details/81157884DataFrame数据框# 巧用复制黏贴>>> import numpy as np>>> import pandas as pd>>> from pandas import Serie...原创 2018-06-02 19:04:55 · 12097 阅读 · 0 评论 -
Pandas入门系列(三)-- 深入理解Series和DataFrame
##数据分析汇总学习 https://blog.csdn.net/weixin_39778570/article/details/81157884DataFrame和Series# 导入需要的模块>>> import pandas as pd>>> import numpy as np>>> from pandas impor...原创 2018-06-02 20:44:21 · 6170 阅读 · 0 评论 -
Numpy简单使用(入门)
数据分析汇总学习https://blog.csdn.net/weixin_39778570/article/details/81157884示例代码:https://www.programcreek.com/python/数组的创建、访问、运算、IO创建#一维>>> import numpy as np>>> list_1 = [...原创 2018-06-02 16:25:38 · 11421 阅读 · 0 评论 -
Pandas入门系列(四) -- Pandas io操作
>>> import numpy as np>>> import pandas as pd>>> from pandas import Series, DataFra原创 2018-07-17 11:49:21 · 4053 阅读 · 0 评论 -
Pandas入门系列(五) -- Indexing和Selecting
import pandas as pdimport numpy as npfrom pandas import Series, DataFrame# df1.csv文件见上一篇In [34]: df = pd.read_csv('df1.csv')In [35]: dfOut[35]: Format Type Data Descriptio...原创 2018-07-17 15:04:41 · 2438 阅读 · 2 评论 -
Pandas入门系列(六) -- reindex
import numpy as npimport pandas as pd from pandas import Series, DataFrame# 创建一个Series对象s1 = Series([1,2,3,4], index=['A','B','C','D'])s1Out[51]: A 1B 2C 3D 4dtype: int64# Se...原创 2018-07-17 16:06:29 · 3359 阅读 · 0 评论 -
Pandas入门系列(七) -- NaN
NaN 意为 Not A Numberimport numpy as npimport pandas as pdfrom pandas import Series, DataFrame# nan类型与运算n = np.nantype(n)Out[8]: float# nan参与运算结果还是nanm = 1n+mOut[11]: nan# Series 中的 nan使用...原创 2018-07-17 19:05:25 · 2374 阅读 · 0 评论 -
Pandas入门系列(八) -- 多级index
import numpy as npimport pandas as pdfrom pandas import Series, DataFrame# 多级Seriess1 = Series(np.random.randn(6), index=[['1','1','1','2','2','2'],['a','b','c','a','b','c']])s1Out[6]: 1 a ...原创 2018-07-17 19:50:34 · 2460 阅读 · 0 评论 -
Pandas入门系列(九) -- Map和replace
import pandas as pdimport numpy as npfrom pandas import Series, DataFramedf1 = DataFrame({"城市":["北京","上海","广州"], "人口":[1000,2000,1500]})df1Out[5]: 人口 城市原创 2018-07-17 20:53:39 · 7165 阅读 · 0 评论 -
Pandas玩转数据(一) -- 简单计算
import numpy as npimport pandas as pdfrom pandas import Series, DataFrame# Series 计算 可以计算加减乘,这里以加法为例s1 = Series([1,2,3], index=['B','C','D'])s2 = Series([4,5,6,7], index=['B','C','D','E'])# 没有的...原创 2018-07-18 21:37:25 · 3156 阅读 · 0 评论 -
Pandas玩转数据(二) -- Series和DataFrame排序
import numpy as npimport pandas as pdfrom pandas import Series, DataFrame# Series排序s1 = Series(np.random.randn(10))s1Out[5]: 0 -1.2934721 0.0175882 -0.6547413 0.4957204 -1.6263...原创 2018-07-18 22:11:26 · 4038 阅读 · 0 评论 -
Pandas玩转数据(三) -- DataFrame重命名
import pandas as pdimport numpy as npfrom pandas import Series, DataFramedf1 = DataFrame(np.arange(9).reshape(3,3), index=['BJ','SH','GZ'], columns=['A','B','C'])df1Out[5]: A B CBJ 0 1...原创 2018-07-18 22:39:03 · 7784 阅读 · 0 评论 -
Pandas玩转数据(四) -- DataFrame的merge
import pandas as pdimport numpy as npfrom pandas import Series, DataFramedf1 = DataFrame({'key':['X','Y','Z'], 'data_set_1':[1,2,3]})df1Out[5]: data_set_1 key0 1 X1 ...原创 2018-07-18 23:14:52 · 3045 阅读 · 0 评论 -
Pandas玩转数据(五) -- Concatenate和Combine
import pandas as pdimport numpy as npfrom pandas import Series, DataFrame# arrange上的Concatenatearr1 = np.arange(9).reshape(3,3)arr1Out[6]: array([[0, 1, 2], [3, 4, 5], [6, 7, 8]]...原创 2018-07-19 00:00:54 · 3959 阅读 · 1 评论 -
Pandas玩转数据(六) -- 通过apply对数据进行处理
import pandas as pdimport numpy as npfrom pandas import Series, DataFrame# 打开一个csv文件对其中一列分成几列,把data列进行分组f = open('apply_demo.csv')df = pd.read_csv(f)df.head()Out[8]: time ...原创 2018-07-19 13:57:23 · 2777 阅读 · 3 评论 -
Pandas玩转数据(七) -- Series和DataFrame去重
import numpy as npimport pandas as pdfrom pandas import Series, DataFramedf = pd.read_csv('demo_duplicate.csv')df.head()Out[40]: Unnamed: 0 Price Seqno Symbol time0 0 1...原创 2018-07-19 14:26:28 · 14421 阅读 · 0 评论 -
Pandas玩转数据(八) -- 时间序列简单操作
import pandas as pdimport numpy as npfrom pandas import Series, DataFramefrom datetime import datetime# 生成一个时间t1 = datetime(2009, 10, 20)t1Out[7]: datetime.datetime(2009, 10, 20, 0, 0)# 手写一...原创 2018-07-19 14:58:53 · 2113 阅读 · 0 评论 -
Kaggle
这次酝酿了很久想给大家讲一些关于Kaggle那点儿事,帮助对数据科学(Data Science)有兴趣的同学们更好的了解这个项目,最好能亲身参与进来,体会一下学校所学的东西和想要解决一个实际的问题所需要的能力的差距。虽然不是Dat...转载 2018-09-02 21:39:45 · 2542 阅读 · 0 评论