自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(18)
  • 收藏
  • 关注

原创 2022年02月14日

1.多音子数据分析:甲方皮实献佩奇甲:2.假设检验:渐渐献祭建(渐)立假设H0反命题H1,选择检(渐)验统计量,根据显(献)著水平一般0.05确定拒绝域,计算(祭)p值做出判断方:3.方差检验:他妈的,烦!他SST = (每个-均值)平方和,妈SSM = (每组均值-均值)平方求和的SSE = (每个 - 每组)平方和,烦F= SSM/SSE * m -1/n - m (m组,e个)皮:5.皮尔逊系数两组数据各减去均值相乘取期望值(协方差)/变准差实:斯皮尔曼系数.

2022-02-15 09:12:01 191

原创 2022年2月12日

1-4略5.数据分析的多维思维模型宏观能力:社会事件中找到方向中观能力:专业度(技术,逻辑,价值)微观能力:沟通力加快速发展收敛,业务交流中发现方向中观能力:技术数据标准化方法max_min,z分数,指数对数法,取出数据标准化,找到价值点,多沉淀多反馈多总结,微观能力很有想象力,很有想象力,有解决问题的能力,敏感度高,高快速发散能力,黄金沟通法则,促活的分析,多问,关心行业内动态,ceo是顶级分析师京东app分析视角要高于普通用户,引流,漏斗,...

2022-02-14 09:25:43 117

原创 2022年2月13日

1.单因子和对比分析的理论知识 -极力抽布1. 集中趋势:均值,中位数与分位数,众数→集[军众[梳]中分]2.离中趋势:标准差,方差→离[查房和平开[除]]3. 数据分布:偏态与峰态,正态分布与三大分布→偏峰正三4.抽样理论:抽样误差,抽样精度→四分位数:(n+1)*0.25/0.5/0.75方差:每个数字减均值,平方,累加,除以总量,→越大越离散,越小越聚拢标准差:取根号是偏态系数:方差变3次/方差二分之三次 → 正数大,负数小峰态系数:方差变4次/方差二次 → 集中强

2022-02-14 09:25:23 174

原创 2022年02月11日

# import time# start_time =time.time()# for a in range(1001):# for b in range(1001):# for c in range(1001):# if a + b + c ==1000 and a**2 + b**2 ==c**2:# print(a,b,c)# end_time = time.time()# print(end_time.

2022-02-12 08:58:39 80

原创 2022年02月10日

JDBC在java语言写sql语句对mysql进行crud,jabc相关的类库在java.sql上,本质是jdbc制定好的纯接口,jdbc本质是一套接口,实际上时sun公司的一套接口,将sun公司指定的jsbc接口进行了实现,import javafx.scene.chart.ScatterChart;import sun.font.TrueTypeFont;import java.sql.*;public class JDBCTest02{ public static void

2022-02-11 08:54:01 67

原创 2022年02年09日

存储引擎,事务隔离性limit的内容1.索引什么是索引是在数据库的字段上添加,为了提高查询效率而添加的是为了提高查询效率的一种机制,一张表的一个字段,当然可以多个字段俩he起来可以添加索引,索引相当于一本书的目录,是为缩小扫描范围而存在的一种机制对于一本字典,一页一页找,第二种是定位到一个大概位置在缩小范围快速查找,如果没有给name字段创建索引,mysql会全扫描,会将所有值都比对一遍,mysql主要是两种方式,主要是全表扫描,或检索.索引是目录,一种是全表扫,如果添加索引根据索引扫描.目录是否需

2022-02-10 09:32:03 91

原创 2022年02月09日

select后面出现子查询语句mysql> select e.ename, e.deptno, (select d.dname from dept d where e.deptno = d.deptno) asdname from emp e;+--------+--------+------------+| ename | deptno | asdname |+--------+--------+------------+| SMITH | 20 | RESEARCH...

2022-02-09 09:16:45 101

原创 2022年02月08日

sql是一种结构化标准的查询语言,程序员主要学习的就是sql语句,sql在mysql中可以使用,同时,在oracel中可以使用也可在db2中也可以使用.操作数据,数据库就是文件具有特定格式的文件,结构化查询语言,先安装数据库管理系统mysql,然后学习sql语句怎么写,编写sql语句之后对dbms对sql语句进行执行,最后完成数据库的数据管理.端口号:端口号port是任何一个软件都会有的,端口号是应用的唯一代表,端口号通话仓和ip地址在一块,ip地址用来定位计算机的,端口号port,是用来定位计算机

2022-02-08 09:06:34 90

原创 数据仓库的分层设计

1.每个source对应数据源,放到数据仓库ODS层:ODS层:第一层: 操作数据层:直接存放在数据抽取的数据,将不同数据汇聚在一起,将soure层的数据汇聚在一起,不需要清洗,分布在同一个DW层:数据仓库DWD层:第二层:数据明细层:通过对维度的轻度聚合,计算对应的统计指标,方便使用DWM层:第三层:数据中间层:对通用的维度进行轻度聚合操作,计算对应的统计指标,方便使用DWS层:第四层:数据服务层:按照主题业务组织主题宽表,用于OLAP分析,做汇总DM层DM层:第五层:基于

2022-01-24 11:16:33 1099

原创 启动CDH时,日志文件卡住不动的问题

有人遇到过类似这样的问题吗,应该怎样解决2021-11-23 10:20:22,330 INFO ScmActive-0:com.cloudera.server.cmf.components.ScmActive: (119 skipped) ScmActive completed successfully.2021-11-23 10:29:58,020 INFO StaleEntityEviction:com.cloudera.server.cmf.StaleEntityEvictionThrea

2021-11-23 11:06:53 1101

原创 机器学习赛事:快来一起挖掘幸福感

快来一起挖掘幸福感(完整篇)本学习笔记为阿里云天池龙珠计划机器学习训练营的学习内容,学习链接为:AI训练营机器学习-阿里云天池赛题介绍(虽然上面链接里已经有了赛题介绍,但我还是把它摘抄下来了,绝对不是水字数(手动狗头)) 理解数据,并进行初步探索和可视化 特征工程 模型搭建特别说明:由于我目前学识尚浅,所以为了提高精确度,在模型搭建部分参考了论坛上一些坛友的作品,在此特别感谢他们的分享。在使用代码时,我也在其中将自己学习时的理解注释在旁边,如果你也是第一次接触到这些模块,可能可以给你

2021-11-04 09:32:26 597

原创 机器学习(三):基于LightGBM的分类预测

本学习笔记为阿里云天池龙珠计划机器学习训练营的学习内容,学习链接为:AI训练营机器学习-阿里云天池LightGBM介绍LightGBM是2017年由微软推出的可扩展机器学习系统,是微软旗下DMKT的一个开源项目,由2014年首届阿里巴巴大数据竞赛获胜者之一柯国霖老师带领开发。它是一款基于GBDT(梯度提升决策树)算法的分布式梯度提升框架,为了满足缩短模型计算时间的需求,LightGBM的设计思路主要集中在减小数据对内存与计算性能的使用,以及减少多机器并行计算时的通讯代价。LightGBM可以看作是

2021-11-03 14:02:33 694

原创 机器学习算法(二): 基于XGBoost的分类预测学习笔记

本学习笔记为阿里云天池龙珠计划Docker训练营的学习内容,学习链接为-天池实验室-实时在线的数据分析协作工具,享受免费计算资源一、XGBoost简介XGBoost是2016年由华盛顿大学陈天奇老师带领开发的一个可扩展机器学习系统。严格意义上讲XGBoost并不是一种模型,而是一个可供用户轻松解决分类、回归或排序问题的软件包。1、XGBoost优缺点:XGBoost的主要优点:简单易用。相对其他机器学习库,用户可以轻松使用XGBoost并获得相当不错的效果。高效可扩展。在处理大规模数据集

2021-11-02 09:10:23 835

原创 机器学习训练营(一): 基于逻辑回归的分类预测学习笔记

本学习笔记为阿里云天池龙珠计划Docker训练营的学习内容,学习链接为-天池实验室-实时在线的数据分析协作工具,享受免费计算资源一、学习知识点概要1 逻辑回归的介绍和应用1.1 逻辑回归的介绍逻辑回归(Logistic regression,简称LR)虽然其中带有"回归"两个字,但逻辑回归其实是一个分类模型,并且广泛应用于各个领域之中。虽然现在深度学习相对于这些传统方法更为火热,但实则这些传统方法由于其独特的优势依然广泛应用于各个领域中。而对于逻辑回归而且,最为突出的两点就是其模型简单和

2021-11-01 19:21:07 140

原创 阿里天池训练营day01:逻辑回归的理论

1.正式开始前很久之前就想了解阿里天池比赛,偶而得到这次阿里天池训练营的消息,正好这些知识自己还没有较好的形成体系,利用这次机会,把机器学习的底子重新打一下,也计划一下自己的学习路径。day01篇夹杂着介绍之类的,下面的就简洁直接做知识的笔记。12天的学习内容主要是下面这些,贵在坚持,let’go这次选择的是单枪匹马的学习,由于时间不固定,所以想更灵活的指定自己的学习路线。学习主要是在天池平台上的自学,里面已经给到了很多的note和code,学习资源还是很充分的,所以学习的时候一部分借鉴平台资料

2021-10-10 10:47:09 78

原创 阿里云—天池SQL训练营 task02笔记+练习题答案

阿里云—天池SQL训练营 task02笔记+练习题答案学习目标:学习内容:一、SELECT语句基础1.1 从表中选取数据1.2从表中选取符合条件的数据1.3 相关法则二、算术运算符和比较运算符2.1 算术运算符2.2 比较运算符2.3 常用法则三、逻辑运算符3.1 NOT运算符3.2 AND运算符和OR运算符3.3 通过括号优先处理3.4 真值表3.5 含有NULL时的真值四、对表进行聚合查询4.1 聚合函数4.2 使用聚合函数删除重复值4.3 常用法则五、对表进行

2021-10-09 08:54:20 94

原创 2021-10-08

多敲代码,运用阿里云天池平台,自学编程虽然是个很不错的想法,但一定要有自己的想法,比如学习哪个方向。 当时具体学哪种,那就主要看想从事哪方面的岗位工作,而且还需要看对哪方面的工作岗位比较感兴趣。我认为最重要的有三点热爱努力(多做项目,每天学习编程 5小时以上)解决问题的能力这三点保证了其次最重要的就是选好方向(深度和广度都得保证,最好是80%时间专精保证深度,20%时间来涉猎各种知识保证广度)学会思考1. 热爱编程这么有趣的事,竟然还有钱赚(by c++ 之父)这个几乎是最重要的,我见过的所有大牛都是都编程

2021-10-08 09:28:59 55

原创 Python训练营打卡 Task1

Python训练营打卡 Task1文章目录Python 中列表和字典的使用和Java, JavaScript对比1. 列表 list1.1 列表(list)的定义1.2 列表添加元素1.2 删除列表的元素1.3 修改列表元素1.4 根据元素得到下标2. 映射/字典dict2.1 定义一个映射/字典2.2 为字典添加元素字典删除元素字典修改元素小结Python很常用的数据类型就是list和dict,但是这些其实并不陌生,在很多语言都有类似的数据类型,比如Java和JavaS..

2021-10-08 09:22:41 80

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除