数据分析
live high,high live
这个作者很懒,什么都没留下…
展开
-
The kernel appears to have died. It will restart automatically
网上查了很多,大多是调用某第三方包时报错,这时更新这个包。但是我的情况不是前者,于是推测还是因为数据量太多,机器跑步下了。尽管我前几天都能跑,但现在内存31.5G,每次还剩3G左右的时候报错。减少数据量,果然就不会出现该报错。...原创 2021-07-29 17:36:44 · 312 阅读 · 0 评论 -
pandas.dataframe筛选含有空值的数据行
筛选非空的数据行:import pandas as pd#返回指定单列中没有空值的数据行df[pd.notnull(df[col])]df[df[col].notnull()]#指定多列 #返回指定多列/df全部列中满足任意一列没有空值的数据行df[df[[cols]].notnull().any(axis=1)] df[pd.notnull(df[[cols]]).any(axis=1)] #返回指定多列中/df全部列中满足所有列没有空值的数据行df[df[[cols]].notn.原创 2020-06-06 21:33:47 · 21106 阅读 · 2 评论 -
scipy.curve_fit报错:Improper input: N=11 must not exceed M=8
N是需要拟合的参数个数,M是样本个数,应该样本个数>参数个数。原创 2020-05-26 15:24:57 · 5519 阅读 · 2 评论 -
scipy.least_squares报错:Residuals are not finite in the initial point.
预测值中存在nan,在func中,y_pred= np.nan_to_num(y_pred)原创 2020-05-21 21:51:48 · 2823 阅读 · 0 评论 -
箱形图
五大因“数”我们一组序列数为例:12,15,17,19,20,23,25,28,30,33,34,35,36,37讲解这五大因“数”1、下四分位数Q1(1)确定四分位数的位置。Qi所在位置=i(n+1)/4,其中i=1,2,3。n表示序列中包含的项数。(2)根据位置,计算相应的四分位数。例中:Q1所在的位置=(14+1)/4=3.75,Q1=0.25×第三项+0.75×第四项=0.2...转载 2018-12-06 12:00:18 · 644 阅读 · 0 评论 -
read_csv和read_table的区别
read_csv和read_table的区别在于separator分隔符。csv是逗号分隔值(Comma-Separated Values),仅能正确读入以 “,” 分割的数据。read_table的分隔符是tab转载 2018-12-24 09:31:20 · 4718 阅读 · 1 评论