自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(23)
  • 收藏
  • 关注

转载 数据运营之信度与测度

信度指的是测量结果的稳定性程度,以及可靠性。效度指一个测量或量表能测出其所要测的某种特征的程度。信度(Reliability)即可靠性,是指采用同一方法对同一对象进行调查时,问卷调查结果的稳定性和一致性,即测量工具(问卷或量表)能否稳定地测量所测的事物或变量。信度指标多以相关系数表示,具体评价方法大致可分为三类:稳定系数(跨时间的一致性),等值系数(跨形式的一致性)和内在一致性系数(跨项目...

2019-03-24 09:33:39 520

原创 python 语法

python 主要有四种命名方式: ----object #公用方法 、_object #半保护 #被看作是“protect”,意思是只有类对象和子类对象自己能访问到这些变量, 在模块或类外不可以使用,不能用’from module import *’导入。 #__object 是为...

2019-03-21 15:27:56 112

转载 求一个集合的子集个数的方法

假设一个集合包含n个元素,要求计算该集合的子集个数。该集合的所有子集,也叫该集合的幂集,比如集合{1,2,3}的所有子集为 空集,{1},{2},{3},{1,2},{1,3},{2,3},{1,2,3}数一数,一共8个,由此推测为2的三次方,即2的三次幂。那么这个结论是否正确呢?方法1:一共集合有n个元素,它的子集的个数就是对这n个元素做组合,一共有n个位置可以组合,每个位置上该元素...

2019-03-18 16:44:47 26606

原创 八大排序算法的python 实现(插入排序、选择排序)

1 插入排序 算法适用于少量数据的排序,是稳定的排序方法。def insert_sort(lists): #插入排序 n = len(lists) for i in range (1,n): for j in range(i,0,-1): if lists[j]<lists[j - 1]: ...

2019-03-18 16:42:54 117

原创 中行信用卡数据岗知识

Spark有3种运行模式:独立集群运行模式、YARN运行模式、Mesos运行模式。 熵是为消除不确定性所需要获得的信息量,投掷均匀正六面体骰子的熵是2.6bit secondarynamenode一般在另外一个节点上运行,需要与namenode一样多大小的内存,作用就是定期合并编辑日志与命名空间镜像,以防止编辑日志过大。 但是该辅助namenode总会滞后于namenode...

2019-03-17 12:19:13 298

原创 第N高的薪水

编写一个Sql查询语句,获取EMmployee表中第 n 高的薪水(Salary)。+----+--------+| Id | Salary |+----+--------+| 1 | 100 || 2 | 200 || 3 | 300 |+----+--------+例如上述 Employee 表,n = 2 时,应返回第二高的薪水 200。如果不存...

2019-03-12 21:19:53 494

原创 关于在Mysql数据库中查询某表中第二大的数据的记录的方法及实现的sql语句

leetcode 171题: 查询第二高的薪水(salary)----------------ID salary1 1002 2003 300----------------------------secondHighestsalary200------------方法一:...

2019-03-12 21:03:04 1324

原创 数据库简介

区块链,云计算,大数据解决的问题:持久化存储(保存在硬盘上) 优化读写 保证数据的有效性(有效性检查机制)关系性数据库:基于E--R模型(Entity--Relationship) 使用sql操作数据库分类:文档型(acess ,sqllite(移动...

2019-03-11 21:40:10 92

原创 网易数据分析信息搜索贴

1 工具 主要使用什么分析工具 会很细 临场出题2数据分析项目 用的什么分析方法 达到什么效果(目标,过程,价值)3 分析方法 具体看什么指标,从哪些维度去数据分析4 数据体系 定位 发展规划----------------------------------------------------------------------------------...

2019-03-11 21:38:45 1010

原创 sql高级教程

select into : 从一个表中选取数据,然后把数据插入到另一表中。select 列名1into 新表 [in 数据库]from 旧表where 列名2 = 值;从一个以上的数据中选取数据也是可以做到的。SELECT Persons.LastName,Orders.OrderNoINTO Persons_Order_BackupFROM PersonsINNER...

2019-03-04 21:38:12 76

原创 SQL函数教程

SQL 用于很多可用于计数和计算的内建函数。select function(列) from 表在Sql中,函数的基本类型是: Aggregate函数(合计函数) scalar函数-----合计函数 :面向一系列的值,并返回一个单一的值 如果在 SELECT 语句的项目列表中的众多其它表达式中使用 SELECT 语句,则这个 SELECT 必须使用...

2019-03-04 21:28:24 230

原创 Excel数据透视表笔记

1 数据透视表 1.1 什么是数据透视表 数据透视表可以快速汇总/分析大量数据表格的交互式分析工具。深入分析数值数据,帮助用户发现关键数据,做出决策。 1.2 为什么使用数据透视表 比函数强 1.3 什么时候使用数据透视表 2. 对数据源的要求 数据源中不能包含合并单元格数据源中不能包含同类字段判断依据:...

2019-03-04 20:03:27 615

原创 sql基础教程

SQL 可在数据库中创建存储过程 SQL 可在数据库中创建视图 SQL 可以设置表、存储过程和视图的权限 SQL:结构化查询语言 SQL 可与数据库程序协同工作,比如 MS Access、DB2、Informix、MS SQL Server、Oracle、Sybase 以及其他数据库系统。 选取列:select 列 from 表 选取多列:select 列1,列2 from...

2019-03-04 16:32:19 93

原创 Excel表哥

1 1985年诞生 Excellent03版本 :功能需要点击07:功能--- 左上角:名称框----左下角:工作表标签-----右下角:视图切换-----正上角:照妖镜数据记录与整理----自定义快速访问工具栏-----Excel 快速访问选项------快速插入工作表与快速查询指定的工作表----深度隐藏与浅度隐藏---怎...

2019-03-03 11:11:53 278

原创 mysql查询练习

学生表Student学号姓名性别出生年月日所在班级课程表Course课程号课程名称教师编号成绩表Score学号课程号成绩教师表Teacher教师编号教师名字教师性别出生年月日职称所在部门-----往数据表中添加数据#添加学生信息#添加教师表#添加课程表#添加成绩表查询...

2019-02-28 21:39:44 192

原创 sql 连接查询4种

sql----内连接 inner join 或join----外连接1左连接 left join 或者left outer join2 右连接 right join 或right outer join3 完全外连接 full join 或 full outer join---创建两个表---person表idnamecardid---car...

2019-02-28 21:37:31 212

原创 数据分析总结1

1.mysql 学习大致流程mysql 必知必会更多的问底层原理和优化,推荐《高性能mysql》 前六章 ----索引优化 底层原理网易 深入浅出mysql刷题:leetcode 牛客 sqlzoo2 从事数据分析百分之70的时间在跑数据,etl,然后xgboost或者Lightgbm,答辩吹数学原理大数据工程师主要是做SQLbat某厂核心部门写了...

2019-02-28 19:40:25 308

原创 数据库的三大设计范式

一:第一范式--1NF数据表中的所有字段都是不可分割的原子值。create table student2( id int primary key, name varchar(20) address varchar(30));insert into student2 values ("1","张三","中国四川省成都市武侯区武侯大道100号");insert into s...

2019-02-27 19:33:34 97

原创 --mysql 学习笔记

---关系型数据库1.如何使用终端操作数据库 如何登陆数据库服务器? mysql -uroot -p123456如何查询数据库服务器中的所有数据库? show databases;如何选中某一个数据库进行操作?use shushe ;sql 语句中的查询:select * from admin ;增加条件...

2019-02-27 19:03:48 124

原创 数据分析师面试准备

1.考察对数据分析岗位的理解与规划 数据分析师与数据工程师的区别在哪儿 你平时都是怎么做数据清洗的 数据分析都用哪些工具 你认为数据分析师应该具备哪些能力 你对自己的职业定位什么、 你的优缺点是什么2.项目举例说明自己参与的一个数据分析项目?(STAR法则)你在这个项目中的贡献项目里使用的算法与策略的原理是什么介绍一下遇到过的比...

2019-02-26 17:00:36 759

原创 数据分析与人打交道

数据分析真正开花结果,关键在于“人”上。第一个人:搞定公司的管理层第二个人:搞定你的竞争者第三个人:搞定你的直属老板第四个人:搞定你的团队第五个人:搞定你的外围数据分析真正开花结果,关键在于“用”上。1)数据分析思路的培养和训练,多去看一些商业数据模型和数据分析案例方面的资料,结合自己的工作场景和特点,形成自己的数据分析思路。2 上手的数据分析工具:利用已有数据和分...

2019-02-26 10:10:41 224

原创 数据科学在金融领域里的应用

1. 金融领域有哪些典型数据问题?2 金融领域应用那些数据科学方法?近年来,数据科学和机器学习应对一系列主要金融任务的能力已成为一个特别重要的问题。 公司希望知道更多技术带来的改进以及他们如何重塑业务战略。为了帮助您回答这些问题,我们准备了一份对金融行业影响最大的数据科学应用清单。 它们涵盖了从数据管理到交易策略的各种业务方面,但它们的共同点是增强金融解决方案的巨大前景。...

2019-02-25 22:48:50 1966

原创 异常值的处理

最近看到数据分析师秋招时关于异常值处理的问题,小白上网搜了以下,特在此做一下总结。何为异常值处理,小白要分异常值和处理两步来介绍。异常值:对整体样本数据结构表达时,通常抓住整体样本一般性的性质,而在这些性质上与样本整体表达不一致的点,称其为异常点。异常值有好有坏,我们可以疾病预测,信用欺诈,网络攻击等。处理:包括检测和修正。检测共有7种,包括1)简单统计df.desc...

2019-02-25 22:24:54 2646

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除