自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

小狐狸

EE转机器学习(深度学习)欢迎一起交流学习~~

  • 博客(3)
  • 资源 (5)
  • 收藏
  • 关注

原创 数据分析必备之sql细节

这里写目录标题条件统计读取jason字符串数据字符串转化jason格式';'转义分组拼接字符串拼接判断字符串是否含有目标字符串str1……返回字符串的位置,没有返回0字符串替换 条件统计 select col1,col2,sum(case when condition1 then value1 else value2) group by col1,col2 读取jason字符串数据 select action[‘key’],action.key,action.data[‘page’] from maidia

2020-11-25 20:13:54 797

原创 数据标准化方法论思考总结

数据标准化总结数据标准化总结元数据管理目录式实现 VS 词素管理应对策略数据字典制定步骤术语解释小例子实施步骤标准化对象收集词素拆分标准单词、标准用户定义数据标准结构词素管理的思考数据词典(数据字典)QA 数据标准化总结 元数据管理 目录式实现 VS 词素管理 目前各个公司或多或少都存在数据标准问题,英文名称中后缀相同,中文名称不同;英文……而且随着业务数据的增加,数据标准问题会像滚雪球一样越积越多。 基于越来越多的数据标准问题,目录式管理元数据(IBM目前就是目录式的),元数据语义层和数据模型建模的关联很

2020-11-12 20:17:59 1629

原创 python数据分析作图细节

python数据分析作图细节seabornbarplot条形图countplot计数图distplotHistograms直方图Kernel density estimaton核密度估计distplot()kdeplot()Fitting parametric distributions拟合参数分布 seaborn 官方链接:http://seaborn.pydata.org/index.html Seaborn是一种基于matplotlib的图形可视化python libraty。它提供了一种高度交互式界

2020-11-10 19:09:16 614

数据分析数据流.zip

数值数据分析流 框架 python code案例 数据分析流框架理解 1、需求 2、y量化 3、x选择 4、描述 4.1图形 4.2统计量 5、预分析(特征工程,流程化和模块化) 5.1、异常值 单变量异常值 多变量异常值 5.2、缺失值 单变量缺失值 多变量缺失值 5.3、特征筛选 单变量特征筛选 多变量特征筛选 5.4、共线性 scipy.optional 单变量 多变量 5.5、变换 单变量 多变量 5.6、编码 单变量编码 多变量编码 6、建模(大模型:机器学习) 小数据算法:8 statsmodel 小数据 大数据算法:20 sklearn 大数据 7、修正 7.1、残差 7.2、假设(清晰清楚) 8、模型评估 8.1、残差 8.2、业务 9、应用 9.1、主次归因 9.2、规则归因 9.3、内衍 9.4、外推 10、可视化 ——————————————— 原文链接:https://blog.csdn.net/u010591976/article/details/106367307

2020-06-02

stopwords.txt

为节省存储空间和提高搜索效率,搜索引擎在索引页面或处理搜索请求时会自动忽略某些字或词,这些字或词即被称为Stop Words(停用词)。通常意义上,Stop Words大致为如下两类: 这些词应用十分广泛,在Internet上随处可见,比如“Web”一词几乎在每个网站上均会出现,对这样的词搜索引擎无法保证能够给出真正相关的搜索结果,难以帮助缩小搜索范围,同时还会降低搜索的效率; 这类就更多了,包括了语气助词、副词、介词、连接词等,通常自身 并无明确的意义,只有将其放入一个完整的句子中才有一定作用,如常见的“的”、“在”之类。 举个例子来说,象“IT技术点评”,虽然其中的“IT”从我们的本意上是指“Information Technology”,事实上这种缩写也能够为大多数人接受,但对搜索引擎来说,此“IT”不过是“it”,即“它”的意思,这在英文中是一个极其常见 同时意思又相当含混的词,在大多数情况下将被忽略。我们在IT技术点评中保留“IT”更多地面向“人”而非搜索引擎,以求用户能明了IT技术点评网站涉及的内容限于信息技术,虽然从SEO的角度这未必是最佳的处理方式。 了解Stop Words,在网页内容中适当地减少Stop Words出现的频率,可以有效地帮助我们提高关键词密度,而在网页Title中避免出现Stop Words往往能够让我们优化的关键词更突出。

2020-02-04

Matlab从入门到精通

适合初学者使用,推荐

2016-12-10

ICEM CFD简明教程(流沙经典)

ICEM CFD简明教程,简单实用,流沙经典,适合入门,图文并茂

2015-10-09

MATLAB智能算法30个案例分析

《MATLAB智能算法30个案例分析》是作者多年从事算法研究的经验总结。书中所有案例均因国内各大MATLAB技术论坛网友的切身需求而精心设计,其中不少案例所涉及的内容和求解方法在国内现已出版的MATLAB书籍中鲜有介绍。《MATLAB智能算法30个案例分析》采用案例形式,以智能算法为主线,讲解了遗传算法、免疫算法、退火算法、粒子群算法、鱼群算法、蚁群算法和神经网络算法等最常用的智能算法的MATLAB实现。

2015-06-11

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除