自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

小狐狸

EE转机器学习(深度学习)欢迎一起交流学习~~

  • 博客(7)
  • 资源 (5)
  • 收藏
  • 关注

原创 python 利用df.drop_duplicates()和df.duplicated()实现查找某字段取值不标准的数据

df.drop_duplicates()DataFrame.drop_duplicates(self, subset=None, keep=‘first’, inplace=False)参数: subset : column label or sequence of labels, optionalOnly consider certain columns for identifyi...

2020-01-12 20:26:25 6873 1

原创 python利用np.where()实现不同条件下的数据处理或者计算

numpy.where (condition[, x, y])用法np.where(condition, x, y)满足条件(condition),输出x,不满足输出y。np.where([[True,False], [True,True]], # 官网上的例子 [[1,2], [3,4]], [[9,8], [7,6]])...

2020-01-08 22:32:26 2333 1

原创 python dataframe时间类型数据预处理以及周期统计

时间类型数据预处理:0、时间格式转换dateframe 日期数据,字符型转换成日期格式:pd.to_datetime(dateframe_timedate,format='%Y/%m/%d %H:%M:%S')常见的报错检查点:格式不匹配,检查原始数据中的日期格式,‘2019/01/01 00:00:00’只能转换成format=’%Y/%m/%d %H:%M:%S’。同理,‘2...

2020-01-08 22:10:37 6144 2

原创 python dataframe计算两个日期之间天数 两种思路(推荐思路2)

思路1:1、字符串转日期格式,对于dataframe格式的日期数据datadf[‘A’]可以采用 pd.to_dataframe(datadf[‘A’])2、对于日期格式的两个数据date1、date2,可以直接采用(date2 - date1).days 得到两个日期之间的天数3、对于dateframe中的日期series,借助 lambda实现.栗子:import numpy a...

2020-01-06 23:29:57 11473 2

原创 python 实现描述性统计、频数分布图、正态分布检验、概率密度曲线拟合

python实现描述性统计、频数分布图、正态分布检验、概率密度曲线拟合from scipy.stats import chi2 # 卡方分布from scipy.stats import norm # 正态分布from scipy.stats import t # t分布from scip...

2020-01-03 21:21:39 5501 1

原创 python 利用dataframe实现连接

merge列连接result_dataframe = pd.merge(left_dataframe, right_dataframe, how='outer', on=['key1', 'key2'])join列连接result_dataframe = left_dataframe.join(right_dataframe, on=['key1', 'key2'], how='inne...

2020-01-02 22:56:24 3342 1

原创 CDA Level 1: Part 1.3 推断性系统学习

推断性系统学习正态分布:三大分布卡方分布:特点:用途:1、单样本方差检验2、离散变量独立性检验 (列联表)3、拟合优度检验(列联表)t分布:特点:用途:1、单样本均值检验(小样本n<30,总体正态,方差未知,估计总体均值)2、F分布:特点:用途:1、双样本方差检验2、离差均方和检验中心极限定理切比雪夫不等式...

2020-01-02 21:52:06 600 2

数据分析数据流.zip

数值数据分析流 框架 python code案例 数据分析流框架理解 1、需求 2、y量化 3、x选择 4、描述 4.1图形 4.2统计量 5、预分析(特征工程,流程化和模块化) 5.1、异常值 单变量异常值 多变量异常值 5.2、缺失值 单变量缺失值 多变量缺失值 5.3、特征筛选 单变量特征筛选 多变量特征筛选 5.4、共线性 scipy.optional 单变量 多变量 5.5、变换 单变量 多变量 5.6、编码 单变量编码 多变量编码 6、建模(大模型:机器学习) 小数据算法:8 statsmodel 小数据 大数据算法:20 sklearn 大数据 7、修正 7.1、残差 7.2、假设(清晰清楚) 8、模型评估 8.1、残差 8.2、业务 9、应用 9.1、主次归因 9.2、规则归因 9.3、内衍 9.4、外推 10、可视化 ——————————————— 原文链接:https://blog.csdn.net/u010591976/article/details/106367307

2020-06-02

stopwords.txt

为节省存储空间和提高搜索效率,搜索引擎在索引页面或处理搜索请求时会自动忽略某些字或词,这些字或词即被称为Stop Words(停用词)。通常意义上,Stop Words大致为如下两类: 这些词应用十分广泛,在Internet上随处可见,比如“Web”一词几乎在每个网站上均会出现,对这样的词搜索引擎无法保证能够给出真正相关的搜索结果,难以帮助缩小搜索范围,同时还会降低搜索的效率; 这类就更多了,包括了语气助词、副词、介词、连接词等,通常自身 并无明确的意义,只有将其放入一个完整的句子中才有一定作用,如常见的“的”、“在”之类。 举个例子来说,象“IT技术点评”,虽然其中的“IT”从我们的本意上是指“Information Technology”,事实上这种缩写也能够为大多数人接受,但对搜索引擎来说,此“IT”不过是“it”,即“它”的意思,这在英文中是一个极其常见 同时意思又相当含混的词,在大多数情况下将被忽略。我们在IT技术点评中保留“IT”更多地面向“人”而非搜索引擎,以求用户能明了IT技术点评网站涉及的内容限于信息技术,虽然从SEO的角度这未必是最佳的处理方式。 了解Stop Words,在网页内容中适当地减少Stop Words出现的频率,可以有效地帮助我们提高关键词密度,而在网页Title中避免出现Stop Words往往能够让我们优化的关键词更突出。

2020-02-04

Matlab从入门到精通

适合初学者使用,推荐

2016-12-10

ICEM CFD简明教程(流沙经典)

ICEM CFD简明教程,简单实用,流沙经典,适合入门,图文并茂

2015-10-09

MATLAB智能算法30个案例分析

《MATLAB智能算法30个案例分析》是作者多年从事算法研究的经验总结。书中所有案例均因国内各大MATLAB技术论坛网友的切身需求而精心设计,其中不少案例所涉及的内容和求解方法在国内现已出版的MATLAB书籍中鲜有介绍。《MATLAB智能算法30个案例分析》采用案例形式,以智能算法为主线,讲解了遗传算法、免疫算法、退火算法、粒子群算法、鱼群算法、蚁群算法和神经网络算法等最常用的智能算法的MATLAB实现。

2015-06-11

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除