python
Einsam0
这个作者很懒,什么都没留下…
展开
-
python 核函数累积概率函数
画直方图的时候,可以叠加个核密度函数,图也很好看,如果对当面这一列数据,画图之后,想知道累积概率那如何获得呢,也就是cdf,pdf倒是容易获得,很多函数直接就有,因为用的多,网上一搜也都能搜到。但是获取累积概率函数,就少很多了。找不到。scipy的包中,也有一个函数说可以求cdf,但是没有说用法,我太笨了,还是不会,后来在stackoverflow找到了一种用法。先画出来pdf的图,也就是概率密度曲线,也就是核密度曲线。这个x是自动生成的等差数列,直方图的区间。ag = stats.gauss原创 2021-07-01 17:17:44 · 1291 阅读 · 0 评论 -
Anaconda添加环境变量
安装anaconda的时候,安装界面有选择,勾选第一个就是价格anaconda添加到环境变量中,后面cmd测试就会发现有,输入conda就会显示详细信息。如果没有勾选,或者像我一样,安装jdk后把之前的环境变量覆盖了,就要重新手动设置环境变量。之前安装anaconda2,添加环境变量就是要添加3个就好:控制面板>系统>高级系统设置>环境变量找到path,新建三...原创 2018-09-12 09:34:31 · 14021 阅读 · 0 评论 -
服务器安装jupyter
服务器版本ubuntu16.041.看一下自带的python版本python --version2.7的版本2.安装pipsudo apt-get install python-pip3.安装jupyterpip install jupyter4.生成配置文件创建密码jupyter notebook --generate-config然后完成以后...原创 2018-09-19 13:46:19 · 991 阅读 · 1 评论 -
控制python数据框的数据精度
需要从python连数据库提取数据的转为数据框,之前也博文也写过如何将数据库数据转为数据框。有一个问题是,原数据库的数据是保留15位小数的数据,例如:20.000000000000000,但是如果转为pd.DataFrame后,就只有六位小数。这是因为在数据框中默认的精度是一个固定值,现在不希望会损失,可以设置数据框的精度。pd.set_option('precision', n...原创 2018-10-12 11:24:36 · 1287 阅读 · 0 评论 -
Leetcode两数相加python(2)
先贴上题目给定两个非空链表来表示两个非负整数。位数按照逆序方式存储,它们的每个节点只存储单个数字。将两数相加返回一个新的链表。你可以假设除了数字 0 之外,这两个数字都不会以零开头。这个题目会在前面写一些变量的定义,给你的代码开个头,上面写的是 type l1: ListNode 因为在python里面没有链表的定义,我以为他说的是list,所以就写了一个,如果讲题目中的链表改为lis...原创 2018-09-28 18:32:25 · 533 阅读 · 0 评论 -
欧几里得算法证明
之前在看算法图解提到过欧几里得算法,当时看了一下,就赶紧去找这个算法相关,并将公式推导了一遍,舒畅。今天还是想简单的写一下,记性太差,怕自己忘记。欧几里得算法要解决的是求两个数最大公约数的问题。这个算法的过程可以举个例子来展示,如果我要求168和44的最大公约数,用欧几里得算法可以这样求:168=44*3+3244=32*1+1232=12*2+812=8*1+48=...原创 2018-10-10 16:46:58 · 2352 阅读 · 4 评论 -
python画矢量图
用matplotlib画图有输出的图放大看会很模糊,即使可以使用fig = plt.figure(figsize=(15,6))#设置画布尺寸这样设置确实是等比例放大的,但是仔细看还是模糊。矢量图的话无论怎么方法也是很清楚。import matplotlibimport matplotlib.pyplot as plt%matplotlib inline%config ...原创 2019-01-08 16:12:22 · 14408 阅读 · 1 评论 -
拉格朗日插值法补齐数据python
书上的代码,然后具体原理公式先占个坑,以后再详细写def ployinterp_column(s, n, k=8): # 取出要插值位置的前后k个数据 y = s[list(range(n - k, n)) + list(range(n + 1, n + 1 + k))] # 剔除空值 y = y[y.notnull()] return lagran...原创 2019-04-24 10:16:00 · 1802 阅读 · 0 评论 -
python线性插值
在缺失值填补上如果用前后的均值填补中间的均值,比如,0,空,1,我们希望中间填充0.5;或者0,空,空,1,我们希望中间填充0.33,0.67这样。可以用pandas的函数进行填充,因为这个就是线性插值法df..interpolate()dd=pd.DataFrame(data=[0,np.nan,np.nan,1])dd.interpolate()...原创 2019-04-25 13:15:12 · 9590 阅读 · 0 评论 -
设置pandas数据框显示最大行数
#如果要设置显示200行#行数pd.set_option('display.max_rows', 200)#列数pd.set_option('display.max_columns', 200)原创 2019-08-23 15:45:48 · 5104 阅读 · 0 评论 -
python画图显示中文加标题控制字体
之前在jupyter用seabron画图的时候一直显示不了中文,在中文前加u,也是不行中文都是正方形的格子,当时用的是python2.7,所以用的是以下的代码import sys# print sys.getdefaultencoding()# ipython notebook中默认是ascii编码 reload(sys)sys.setdefaultencoding('utf8')...原创 2018-09-11 17:37:22 · 6582 阅读 · 3 评论 -
cmd用conda语句安装python包
cmd下用conda语句安装python包开始安装anaconda的时候可以将anaconda加入环境变量,这样安装一些python的包可以直接打开cmd窗口输入conda install 库名,就非常的方便,不过有时候在cmd下下语句,不知道是什么语法,所以在此总结一下自己遇到的常用的,以后遇到了再更新。一些基本语句 conda list : 显示之前已经安装好的库 ...原创 2018-08-31 10:49:45 · 2144 阅读 · 0 评论 -
五点三次平滑+python实现
在处理工业数据的时候,工业数据有数据颗粒细,噪声大,量大,随着测量点的增加,数据维度高,复杂性高,而且关联性强,不过这个关联性是相对的,因为有时候数据噪声较大,显示不出来这种关联性。最近了解的五点三次平滑,在一个工业数据处理平台上有这个,就很疑惑为什么要用这个,搜了很多都是matlab写的代码,没有说明为什么用这个方法,就去知网搜了几篇论文,引用这些文献的解释:“一般来说,在数据采集系统中...原创 2018-08-17 11:31:50 · 8347 阅读 · 4 评论 -
利用PIL包画表格
from PIL import Image, ImageDraw, ImageFontim = Image.new ('RGB', (600, 300), (255, 255, 255))draw = ImageDraw.Draw(im)draw.rectangle((0, 0, 500, 280), 'white', 'black')draw.line((0, 40,500, 4原创 2017-11-16 14:12:26 · 953 阅读 · 0 评论 -
用python的画表格
%matplotlib inlinefrom matplotlib import pyplot as pltimport numpy as nprandn = np.random.randnfrom pandas import *idx = Index(np.arange(1,7))df = DataFrame(randn(6, 4), index=idx, columns=['A',...原创 2017-11-16 13:51:35 · 20238 阅读 · 3 评论 -
用python画出和excel一样的折线图加柱状图用多种线条和柱的颜色
用python写分析代码的朋友说因为excel的图比较好看,所以没有用python,用了excel画图,我觉得已经用了Python,再调用excel画图比较麻烦,就觉得应该可以画出和excel一样的图出来,所以就试了下。excel画的原图为:(由于数据保密,所以用了随机数生成的图)excel画的图确实好看,而又有颜色区分,线条也有区分。不过我觉得python是一定能画出来这种图的,原创 2017-12-06 18:11:58 · 8527 阅读 · 0 评论 -
2018/8/9-读取txt文件将所有数据四舍五入写入csv
朋友说有一个ascii文件,应该是司徒文件,不同的颜色是不同的数字这种。朋友本想放到excel里打开,然后设置单元格式,四舍误入,但是就出现全都是9999,显示不出来其他的数值。所以我就用python弄一下。ascii数据我用TXT打开,并以这种格式保存。import sysresult=[]with open("...\Desktop\\test.txt") as f: for ...原创 2018-08-10 16:43:49 · 606 阅读 · 0 评论 -
.apply()替代for循环减少处理数据时间
目的是希望讲时间对其,开始写for循环,差不多30分钟,然后用apply后a=[]d=[]df1=pd.DataFrame(None,columns=['datetime','IO_2008',])for i in range(len(IO_Values[id[0]])): aa=IO_Values[id[0]][i][1] tm=IO_Values[id[0]][i...原创 2018-08-14 11:13:01 · 4067 阅读 · 3 评论 -
2018/8/14pandas一些好用的用法
1.对数据框差分df.diff() 所有数据列差分,下一行减去上一行,默认axis=0。设置axis=1就是左右差分,可以做二阶差分df.diff(2)。2.根据时间平滑/重采样df10=dfnew.resample('10min',how='mean')索引是datetime,原来的时间索引是每30秒一次,how选择mean,就是每10分钟取一次平均来将数据量变少,变得平滑。...原创 2018-08-14 16:53:28 · 292 阅读 · 0 评论 -
2018/8/2-日常以及用到的方法
1.如果格式是datetime,想转换成字符串,可以用aa=list(data['datetime'][i])[0].strftime('%Y-%m-%d %H:%M:%S')aa是空的list,data是数据框,想把数据框中datetime变成字符串存进来;2.今天发现,生成一个dataframe不仅可以用pd.DataFrame(data,columns=[],index=[])...原创 2018-08-02 17:20:22 · 184 阅读 · 0 评论 -
2018/8/7-调整时间对齐用一些数据框操作
时间序列数据的时间一般是每隔30秒更新,后来就变了,开始都是00s,30s,这样的间隔,后面尾数就不是这样了,比如22,52,15,45这种,也是因为这个存储的方法的问题,如果下一个时段检测的数据和上一个时间测得结果相同,就不更新数据,所以有一个将数据补齐的过程。我的想法是将这个不是0和30结尾的,作为延迟来考虑,就比如22,那就是说明延迟了22s,我将它归为22。这样想的原因是,这个隔30秒测一...原创 2018-08-08 08:44:08 · 642 阅读 · 0 评论 -
2018/8/8-sqlserver读的数据转为数据框格式
今天特别气自己,想骂人。今天还是北京奥运十周年。之前连数据库用来同事发给我的代码去连,然后一般数据都是存在rows里。 cursor.execute(sql) rows = cursor.fetchall()我自己写是加了一个list,因为他这个每一行都是元组,元组又不能修改,也没什么方法。然后这个数据框是一行,我自己又写个for循环,将着一行两个变量拆开。我也知道...原创 2018-08-08 15:54:47 · 335 阅读 · 0 评论 -
在jupyter中不显示数据框的索引
转自stackoverflow:https://stackoverflow.com/questions/42813123/pandas-dataframe-styler-html-display-without-index一原创 2017-11-16 17:49:19 · 2420 阅读 · 0 评论