- 博客(7)
- 资源 (5)
- 收藏
- 关注
原创 python 利用df.drop_duplicates()和df.duplicated()实现查找某字段取值不标准的数据
df.drop_duplicates()DataFrame.drop_duplicates(self, subset=None, keep=‘first’, inplace=False)参数: subset : column label or sequence of labels, optionalOnly consider certain columns for identifyi...
2020-01-12 20:26:25 6873 1
原创 python利用np.where()实现不同条件下的数据处理或者计算
numpy.where (condition[, x, y])用法np.where(condition, x, y)满足条件(condition),输出x,不满足输出y。np.where([[True,False], [True,True]], # 官网上的例子 [[1,2], [3,4]], [[9,8], [7,6]])...
2020-01-08 22:32:26 2333 1
原创 python dataframe时间类型数据预处理以及周期统计
时间类型数据预处理:0、时间格式转换dateframe 日期数据,字符型转换成日期格式:pd.to_datetime(dateframe_timedate,format='%Y/%m/%d %H:%M:%S')常见的报错检查点:格式不匹配,检查原始数据中的日期格式,‘2019/01/01 00:00:00’只能转换成format=’%Y/%m/%d %H:%M:%S’。同理,‘2...
2020-01-08 22:10:37 6144 2
原创 python dataframe计算两个日期之间天数 两种思路(推荐思路2)
思路1:1、字符串转日期格式,对于dataframe格式的日期数据datadf[‘A’]可以采用 pd.to_dataframe(datadf[‘A’])2、对于日期格式的两个数据date1、date2,可以直接采用(date2 - date1).days 得到两个日期之间的天数3、对于dateframe中的日期series,借助 lambda实现.栗子:import numpy a...
2020-01-06 23:29:57 11473 2
原创 python 实现描述性统计、频数分布图、正态分布检验、概率密度曲线拟合
python实现描述性统计、频数分布图、正态分布检验、概率密度曲线拟合from scipy.stats import chi2 # 卡方分布from scipy.stats import norm # 正态分布from scipy.stats import t # t分布from scip...
2020-01-03 21:21:39 5501 1
原创 python 利用dataframe实现连接
merge列连接result_dataframe = pd.merge(left_dataframe, right_dataframe, how='outer', on=['key1', 'key2'])join列连接result_dataframe = left_dataframe.join(right_dataframe, on=['key1', 'key2'], how='inne...
2020-01-02 22:56:24 3342 1
原创 CDA Level 1: Part 1.3 推断性系统学习
推断性系统学习正态分布:三大分布卡方分布:特点:用途:1、单样本方差检验2、离散变量独立性检验 (列联表)3、拟合优度检验(列联表)t分布:特点:用途:1、单样本均值检验(小样本n<30,总体正态,方差未知,估计总体均值)2、F分布:特点:用途:1、双样本方差检验2、离差均方和检验中心极限定理切比雪夫不等式...
2020-01-02 21:52:06 600 2
数据分析数据流.zip
2020-06-02
stopwords.txt
2020-02-04
MATLAB智能算法30个案例分析
2015-06-11
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人