- 博客(33)
- 资源 (1)
- 收藏
- 关注
原创 pandas之groupby学习笔记
pandas库的groupby问题一、对象分组1 一个简单例子In [1]: df = pd.DataFrame([('bird', 'Falconiformes', 389.0), ...: ('bird', 'Psittaciformes', 24.0), ...: ('mammal', 'Carni...
2019-07-16 12:18:44
990
原创 sklearn之一元线性回归模型
文章代码基于jupyter notebook运行首先,安装必要的库:import pandas as pdimport numpy as npimport matplotlib.pyplot as pltfrom sklearn import linear_model读取csv数据集,并大致预览:df = pd.read_csv('d:/boston_house_prices....
2018-11-25 23:55:08
820
原创 R语言速成_尹鸿(三)常用命令
ls()> ls()character(0)> data <- c(1, 2, 4, 5)> string <- "I like R"> ls()[1] "data" "string"> rm(data)>
2018-11-24 23:48:36
352
原创 pygal文档——箱型图
import pygalfrom IPython.display import SVGbox_plot = pygal.Box()box_plot.title = 'V8 benchmark results'box_plot.add('Chrome', [6395, 8212, 7520, 7218, 12464, 1660, 2123, 8607])box_plot.add('Fire...
2018-11-23 20:35:55
407
原创 pygal文档——雷达图
画雷达图import pygalfrom IPython.display import SVGradar_chart = pygal.Radar()radar_chart.title = 'V8 benchmark results'radar_chart.x_labels = ['Richards', 'DeltaBlue', 'Crypto', 'RayTrace', 'EarleyB...
2018-11-22 10:38:26
1044
原创 pygal文档——饼状图
基本操作import pygalfrom IPython.display import SVGpie_chart = pygal.Pie()pie_chart.title = 'Browser usage in February 2012 (in %)'pie_chart.add('IE', 19.5)pie_chart.add('Firefox', 36.6)pie_chart.a...
2018-11-21 11:09:18
960
1
原创 pygal文档——XY图(二)
日期datetime格式import pygalfrom IPython.display import SVGfrom datetime import datetimedatetimeline = pygal.DateTimeLine( x_label_rotation=35, truncate_label=-1, x_value_formatter=lambda dt:...
2018-11-20 15:13:51
257
原创 pygal文档——XY图(一)
基础知识import pygalfrom IPython.display import SVGfrom math import cosxy_chart = pygal.XY()xy_chart.title = 'XY Cosinus'xy_chart.add('x = cos(y)', [(cos(x / 10.), x / 10.) for x in range(-50, 50,...
2018-11-19 14:52:23
1093
原创 R语言速成_尹鸿(二)数据类型
数据类型向量c一维数据,必须相同类型> a <- c(1,3,5,7)> a[1] 1 3 5 7#若输入不同类型,则发生转化> a <- c(1,'123')> a[1] &quot
2018-11-18 23:45:29
318
原创 pygal文档——直方图
基本操作import pygalfrom IPython.display import SVGhist = pygal.Histogram()hist.add('Wide bars', [(5, 0, 10), (4, 5, 13), (2, 0, 15)])hist.add('Narrow bars', [(10, 1, 2), (12, 4, 4.5), (8, 11, 13)])...
2018-11-17 00:01:42
214
原创 pygal文档——条形图
条形图基本操作import pygalfrom IPython.display import SVGline_chart = pygal.Bar()line_chart.title = 'Browser usage evolution (in %)'line_chart.x_labels = map(str, range(2002, 2013))line_chart.add('Fir...
2018-11-16 00:04:44
399
原创 pygal文档——折线图
折线图基础import pygalfrom IPython.display import SVGline_chart = pygal.Line()line_chart.title = 'Browser usage evolution (in %)'line_chart.x_labels = map(str, range(2002, 2013))line_chart.add('Fire...
2018-11-15 10:32:20
1694
原创 pygal文档——first steps
pygal官方文档第一步注意:首先需要安装pygal包:pip install pygalimport pygal # First import pygalbar_chart = pygal.Bar() ...
2018-11-14 11:09:24
620
原创 pandas_cookbook学习(九)——apply
Apply应用函数:In [135]: df = pd.DataFrame(data={'A' : [[2,4,8,16],[100,200],[10,20,30]], 'B' : [['a','b','c'],['jj','kk'],['ccc']]},index=['I','II','III']); df A BI [2, 4, 8, 16] [a, b, c]II [100, 20...
2018-11-13 13:14:37
104
原创 pandas_cookbook学习(八)
切片一个数据集:In [122]: df = pd.DataFrame(data={'Case' : ['A','A','A','B','A','A','B','A','A'], .....: 'Data' : np.random.randn(9)}) .....: In [123]: dfs = list(zip(*df.grou...
2018-11-12 10:17:23
184
原创 pandas_cookbook学习(七)
根据索引值将每一组数据滞后一项:In [112]: df = pd.DataFrame( .....: {u'line_race': [10, 10, 8, 10, 10, 8], .....: u'beyer': [99, 102, 103, 103, 88, 100]}, .....: index=[u'Last Gunfighter', u'Last...
2018-11-11 21:53:58
156
原创 R语言速成_尹鸿(一)基本操作
赋值> x <- 5 #赋值> ls() #查看已经创建的变量[1] "x"> age <- c(1,3,5,2,11,9,3,9,12,3)> weight <- c(4.4,5.3,7.2,5.2,8.5,7.3,6.0,10
2018-11-10 21:50:12
1631
原创 pandas_cookbook学习(六)
使用resample和apply函数分别变换:In [103]: rng = pd.date_range(start="2014-10-07",periods=10,freq='2min')In [104]: ts = pd.Series(data = list(range(10)), index = rng)In [105]: def MyCust(x): .....: i...
2018-11-09 08:12:41
116
原创 pandas_cookbook学习(五)
使用剩下值的均值代替此值,注意transform的用法,与apply相区分:apply返回一个聚类结果,transform分别返回每个处理的结果In [94]: df = pd.DataFrame({'A' : [1, 1, 2, 2], 'B' : [1, -1, 1, 2]})In [95]: gb = df.groupby('A')In [96]: def replace(g):...
2018-11-08 10:52:42
156
原创 pandas_cookbook学习(四)
Missing DataThe missing data docs.Fill forward a reversed timeseriesIn [79]: df = pd.DataFrame(np.random.randn(6,1), index=pd.date_range(‘2013-08-01’, periods=6, freq=‘B’), columns=list(‘A’))In [8...
2018-11-07 17:37:40
132
原创 pandas_cookbook学习(三)
多重索引> df = pd.DataFrame({'row' : [0,1,2], ....: 'One_X' : [1.1,1.1,1.1], ....: 'One_Y' : [1.2,1.2,1.2], ....: 'Two_X' : [1.11,1.11...
2018-11-06 12:22:32
214
原创 pandas_cookbook学习(二)
选择数据dataframes> df = pd.DataFrame( ....: {'AAA' : [4,5,6,7], 'BBB' : [10,20,30,40],'CCC' : [100,50,-30,-50]}); df AAA BBB CCC0 4 10 1001 5 20 502 6 30 -303 7 40 -50#设定两个“或”条件筛选数据&...
2018-11-05 11:24:28
146
原创 pandas_cookbook学习(一)
import pandas as pdimport numpy as npIdiomsdf = pd.DataFrame( ...: {'AAA' : [4,5,6,7], 'BBB' : [10,20,30,40],'CCC' : [100,50,-30,-50]}); df AAA BBB CCC0 4 10 1001 5 20 502 6 30 -303 7...
2018-11-04 12:22:57
246
原创 pandas纵向学习之10 minutes to pandas(三)
操作数学统计df.mean() #查看每列的平均值df.mean(1) #查看每行的平均值s = pd.Series([1,3,5,np.nan,6,8], index=dates).shift(2)sdf.sub(s, axis='index')A B C D F2013-01-01 NaN NaN NaN NaN NaN2013-01-02 NaN NaN NaN NaN ...
2018-11-02 09:06:36
195
原创 pandas纵向学习之10 minutes to pandas(二)
pandas纵向学习之10 minutes to pandas(一)布尔值索引df[df.A>0] A B C D2013-01-02 0.356680 -0.468280 1.293093 -0.7522512013-01-03 1.179930 0.407866 -1.733382 -0.1284742013-01-05 1.398427 0.087443 -1.0327...
2018-11-01 09:59:21
167
原创 pandas纵向学习之10 minutes to pandas(一)
10mins官方文档10 Minutes to pandas必要的库导入:import pandas as pdimport numpy as npimport matplotlib.pyplot as plt创建对象pandas常用数据类型有两个:series和dataframe。创建一个series:s = pd.Series([1,3,5,np.nan,6,8])s...
2018-10-31 09:10:47
369
原创 pandas横向学习之创建
pandas.Series文档1.series的创建class pandas.Series(data=None, index=None, dtype=None, name=None, copy=False, fastpath=False)Parametersmeansdataarray-like, dict, or scalar value. Contains da...
2018-10-30 15:38:12
245
原创 urllib之异常处理
urllib.error官方文档致谢@Jack-Cuihttp错误代码官方文档展示了urllib.error的三种异常:1.URLError1.1 产生原因本地不能联网服务期不存在连接不到服务器注意:HTTPError也是其子类1.2 异常演示1.2.1 超时错误:from urllib import request, errorurl = "http://ww...
2018-10-29 12:08:53
1248
1
原创 爬取bing每日美图作为桌面背景
需先安装pypiwin32,可通过如下代码安装:pip install pypiwin32完整代码:import reimport win32gui, win32con, win32apifrom urllib import requesturl = "https://cn.bing.com/"headers = {'User-Agent': 'Mozilla/5.0 (Li...
2018-10-28 09:55:26
1511
原创 urllib之爬虫
urllib-Python3文档链接1.初识urlliburllib库包含以下模块:urllib.request——打开和读取 URLsurllib.error——urllib.request异常处理urllib.parse——解码URLsurllib.robotparser——解码robots.txt2.urllib&爬虫2.1 简单的get方法from urlli...
2018-10-27 15:45:34
246
1
原创 Python计算贝塔系数和夏普比率
1.贝塔系数1.1理论含义贝塔系数衡量了个股或基金相对于整个股市的波动情况。β范围含义β=1股票或基金的风险收益率与市场平均风险收益率相同β>1股票或基金的风险相较于市场平均更大β<1股票或基金的风险相较于市场平均更小2.夏普比率2.1理论含义衡量股票或基金所获得的风险溢价,即如果股票或基金额外承担一单位的风险,可以获得多少单位的收...
2018-10-27 10:12:10
17339
12
原创 dataframe导出csv乱码问题
不要使用gbk或utf8格式输出,而是:df.to_csv('b.csv',encoding='utf_8_sig')
2018-10-27 00:03:40
4928
5
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人