自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

thfyshz的博客

一花一世界

  • 博客(33)
  • 资源 (1)
  • 收藏
  • 关注

原创 pandas之groupby学习笔记

pandas库的groupby问题一、对象分组1 一个简单例子In [1]: df = pd.DataFrame([('bird', 'Falconiformes', 389.0), ...: ('bird', 'Psittaciformes', 24.0), ...: ('mammal', 'Carni...

2019-07-16 12:18:44 990

原创 sklearn之一元线性回归模型

文章代码基于jupyter notebook运行首先,安装必要的库:import pandas as pdimport numpy as npimport matplotlib.pyplot as pltfrom sklearn import linear_model读取csv数据集,并大致预览:df = pd.read_csv('d:/boston_house_prices....

2018-11-25 23:55:08 820

原创 R语言速成_尹鸿(三)常用命令

ls()> ls()character(0)> data <- c(1, 2, 4, 5)> string <- "I like R"> ls()[1] "data" "string"> rm(data)>

2018-11-24 23:48:36 352

原创 pygal文档——箱型图

import pygalfrom IPython.display import SVGbox_plot = pygal.Box()box_plot.title = 'V8 benchmark results'box_plot.add('Chrome', [6395, 8212, 7520, 7218, 12464, 1660, 2123, 8607])box_plot.add('Fire...

2018-11-23 20:35:55 407

原创 pygal文档——雷达图

画雷达图import pygalfrom IPython.display import SVGradar_chart = pygal.Radar()radar_chart.title = 'V8 benchmark results'radar_chart.x_labels = ['Richards', 'DeltaBlue', 'Crypto', 'RayTrace', 'EarleyB...

2018-11-22 10:38:26 1044

原创 pygal文档——饼状图

基本操作import pygalfrom IPython.display import SVGpie_chart = pygal.Pie()pie_chart.title = 'Browser usage in February 2012 (in %)'pie_chart.add('IE', 19.5)pie_chart.add('Firefox', 36.6)pie_chart.a...

2018-11-21 11:09:18 960 1

原创 pygal文档——XY图(二)

日期datetime格式import pygalfrom IPython.display import SVGfrom datetime import datetimedatetimeline = pygal.DateTimeLine( x_label_rotation=35, truncate_label=-1, x_value_formatter=lambda dt:...

2018-11-20 15:13:51 257

原创 pygal文档——XY图(一)

基础知识import pygalfrom IPython.display import SVGfrom math import cosxy_chart = pygal.XY()xy_chart.title = 'XY Cosinus'xy_chart.add('x = cos(y)', [(cos(x / 10.), x / 10.) for x in range(-50, 50,...

2018-11-19 14:52:23 1093

原创 R语言速成_尹鸿(二)数据类型

数据类型向量c一维数据,必须相同类型> a <- c(1,3,5,7)> a[1] 1 3 5 7#若输入不同类型,则发生转化> a <- c(1,'123')> a[1] &quot

2018-11-18 23:45:29 318

原创 pygal文档——直方图

基本操作import pygalfrom IPython.display import SVGhist = pygal.Histogram()hist.add('Wide bars', [(5, 0, 10), (4, 5, 13), (2, 0, 15)])hist.add('Narrow bars', [(10, 1, 2), (12, 4, 4.5), (8, 11, 13)])...

2018-11-17 00:01:42 214

原创 pygal文档——条形图

条形图基本操作import pygalfrom IPython.display import SVGline_chart = pygal.Bar()line_chart.title = 'Browser usage evolution (in %)'line_chart.x_labels = map(str, range(2002, 2013))line_chart.add('Fir...

2018-11-16 00:04:44 399

原创 pygal文档——折线图

折线图基础import pygalfrom IPython.display import SVGline_chart = pygal.Line()line_chart.title = 'Browser usage evolution (in %)'line_chart.x_labels = map(str, range(2002, 2013))line_chart.add('Fire...

2018-11-15 10:32:20 1694

原创 pygal文档——first steps

pygal官方文档第一步注意:首先需要安装pygal包:pip install pygalimport pygal # First import pygalbar_chart = pygal.Bar() ...

2018-11-14 11:09:24 620

原创 pandas_cookbook学习(九)——apply

Apply应用函数:In [135]: df = pd.DataFrame(data={'A' : [[2,4,8,16],[100,200],[10,20,30]], 'B' : [['a','b','c'],['jj','kk'],['ccc']]},index=['I','II','III']); df A BI [2, 4, 8, 16] [a, b, c]II [100, 20...

2018-11-13 13:14:37 104

原创 pandas_cookbook学习(八)

切片一个数据集:In [122]: df = pd.DataFrame(data={'Case' : ['A','A','A','B','A','A','B','A','A'], .....: 'Data' : np.random.randn(9)}) .....: In [123]: dfs = list(zip(*df.grou...

2018-11-12 10:17:23 184

原创 pandas_cookbook学习(七)

根据索引值将每一组数据滞后一项:In [112]: df = pd.DataFrame( .....: {u'line_race': [10, 10, 8, 10, 10, 8], .....: u'beyer': [99, 102, 103, 103, 88, 100]}, .....: index=[u'Last Gunfighter', u'Last...

2018-11-11 21:53:58 156

原创 R语言速成_尹鸿(一)基本操作

赋值> x <- 5 #赋值> ls() #查看已经创建的变量[1] "x"> age <- c(1,3,5,2,11,9,3,9,12,3)> weight <- c(4.4,5.3,7.2,5.2,8.5,7.3,6.0,10

2018-11-10 21:50:12 1631

原创 pandas_cookbook学习(六)

使用resample和apply函数分别变换:In [103]: rng = pd.date_range(start="2014-10-07",periods=10,freq='2min')In [104]: ts = pd.Series(data = list(range(10)), index = rng)In [105]: def MyCust(x): .....: i...

2018-11-09 08:12:41 116

原创 pandas_cookbook学习(五)

使用剩下值的均值代替此值,注意transform的用法,与apply相区分:apply返回一个聚类结果,transform分别返回每个处理的结果In [94]: df = pd.DataFrame({'A' : [1, 1, 2, 2], 'B' : [1, -1, 1, 2]})In [95]: gb = df.groupby('A')In [96]: def replace(g):...

2018-11-08 10:52:42 156

原创 pandas_cookbook学习(四)

Missing DataThe missing data docs.Fill forward a reversed timeseriesIn [79]: df = pd.DataFrame(np.random.randn(6,1), index=pd.date_range(‘2013-08-01’, periods=6, freq=‘B’), columns=list(‘A’))In [8...

2018-11-07 17:37:40 132

原创 pandas_cookbook学习(三)

多重索引> df = pd.DataFrame({'row' : [0,1,2], ....: 'One_X' : [1.1,1.1,1.1], ....: 'One_Y' : [1.2,1.2,1.2], ....: 'Two_X' : [1.11,1.11...

2018-11-06 12:22:32 214

原创 pandas_cookbook学习(二)

选择数据dataframes> df = pd.DataFrame( ....: {'AAA' : [4,5,6,7], 'BBB' : [10,20,30,40],'CCC' : [100,50,-30,-50]}); df AAA BBB CCC0 4 10 1001 5 20 502 6 30 -303 7 40 -50#设定两个“或”条件筛选数据&...

2018-11-05 11:24:28 146

原创 pandas_cookbook学习(一)

import pandas as pdimport numpy as npIdiomsdf = pd.DataFrame( ...: {'AAA' : [4,5,6,7], 'BBB' : [10,20,30,40],'CCC' : [100,50,-30,-50]}); df AAA BBB CCC0 4 10 1001 5 20 502 6 30 -303 7...

2018-11-04 12:22:57 246

原创 pandas纵向学习之10 minutes to pandas(四)

时间序列

2018-11-03 00:05:13 320

原创 pandas纵向学习之10 minutes to pandas(三)

操作数学统计df.mean() #查看每列的平均值df.mean(1) #查看每行的平均值s = pd.Series([1,3,5,np.nan,6,8], index=dates).shift(2)sdf.sub(s, axis='index')A B C D F2013-01-01 NaN NaN NaN NaN NaN2013-01-02 NaN NaN NaN NaN ...

2018-11-02 09:06:36 195

原创 pandas纵向学习之10 minutes to pandas(二)

pandas纵向学习之10 minutes to pandas(一)布尔值索引df[df.A>0] A B C D2013-01-02 0.356680 -0.468280 1.293093 -0.7522512013-01-03 1.179930 0.407866 -1.733382 -0.1284742013-01-05 1.398427 0.087443 -1.0327...

2018-11-01 09:59:21 167

原创 pandas纵向学习之10 minutes to pandas(一)

10mins官方文档10 Minutes to pandas必要的库导入:import pandas as pdimport numpy as npimport matplotlib.pyplot as plt创建对象pandas常用数据类型有两个:series和dataframe。创建一个series:s = pd.Series([1,3,5,np.nan,6,8])s...

2018-10-31 09:10:47 369

原创 pandas横向学习之创建

pandas.Series文档1.series的创建class pandas.Series(data=None, index=None, dtype=None, name=None, copy=False, fastpath=False)Parametersmeansdataarray-like, dict, or scalar value. Contains da...

2018-10-30 15:38:12 245

原创 urllib之异常处理

urllib.error官方文档致谢@Jack-Cuihttp错误代码官方文档展示了urllib.error的三种异常:1.URLError1.1 产生原因本地不能联网服务期不存在连接不到服务器注意:HTTPError也是其子类1.2 异常演示1.2.1 超时错误:from urllib import request, errorurl = "http://ww...

2018-10-29 12:08:53 1248 1

原创 爬取bing每日美图作为桌面背景

需先安装pypiwin32,可通过如下代码安装:pip install pypiwin32完整代码:import reimport win32gui, win32con, win32apifrom urllib import requesturl = "https://cn.bing.com/"headers = {'User-Agent': 'Mozilla/5.0 (Li...

2018-10-28 09:55:26 1511

原创 urllib之爬虫

urllib-Python3文档链接1.初识urlliburllib库包含以下模块:urllib.request——打开和读取 URLsurllib.error——urllib.request异常处理urllib.parse——解码URLsurllib.robotparser——解码robots.txt2.urllib&爬虫2.1 简单的get方法from urlli...

2018-10-27 15:45:34 246 1

原创 Python计算贝塔系数和夏普比率

1.贝塔系数1.1理论含义贝塔系数衡量了个股或基金相对于整个股市的波动情况。β范围含义β=1股票或基金的风险收益率与市场平均风险收益率相同β>1股票或基金的风险相较于市场平均更大β<1股票或基金的风险相较于市场平均更小2.夏普比率2.1理论含义衡量股票或基金所获得的风险溢价,即如果股票或基金额外承担一单位的风险,可以获得多少单位的收...

2018-10-27 10:12:10 17339 12

原创 dataframe导出csv乱码问题

不要使用gbk或utf8格式输出,而是:df.to_csv('b.csv',encoding='utf_8_sig')

2018-10-27 00:03:40 4928 5

10分钟学pandas中文版

pandas官网文档10 minutes to pandas的中文版,方便阅读。

2018-11-05

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除