- 博客(35)
- 资源 (36)
- 收藏
- 关注
原创 一家有两个孩子,已知至少有一个孩子是在星期二出生的男孩。问:两个孩子都是男孩的概率是多大?
这道题想都没想就是 0.5,第二个孩子是男是女不是一样吗!!!然而答案是 13/27,好吧,让我来昧着初心强行解释一下:把这道题必须用贝叶斯公式来做,因为我也不知道多出来的信息“周二出生”引起多少改变。贝叶斯公式:P(2男∣1男周二)=P(2男,至少1男周二)P(1男周二)=P(至少1男周二∣2男)P(2男)P(1男周二)P(2男|1男周二) = \frac{P(2男 ,至少1男周二)}{P(1男周二)} = \frac{P(至少1男周二|2男)P(2男)}{P(1男周二)}P(2男∣1男周
2020-07-30 23:54:26 3610
转载 欧拉函数
对正整数n,欧拉函数是小于或等于n的正整数中与n互质的数的数目(因此φ(1)=1)。此函数以其首名研究者欧拉命名(Euler’s totient function),它又称为Euler’s totient function、φ函数、欧拉商数等。ϕ(x)=x(1−1p1)⋯(1−1pk)\phi(x) = x (1-\frac{1}{p_1}) \cdots (1-\frac{1}{p_k})ϕ(x)=x(1−p11)⋯(1−pk1)其中 p1,p2,…,pkp_1, p_2,\ldots.
2020-07-30 22:34:30 2535
原创 样本方差是总体方差的无偏估计
总体均值 μ=1N∑xi\mu = \frac{1}{N}\sum x_iμ=N1∑xi, 总体方差 σ2=1N∑i(xi−μ)2\sigma^2 = \frac{1}{N}\sum_i (x_i - \mu)^2σ2=N1∑i(xi−μ)2样本均值 xˉ=1n∑xi\bar{x} = \frac{1}{n}\sum x_ixˉ=n1∑xi, 样本方差 S2=1n−1∑i(xi−xˉ)2S^2 = \frac{1}{n-1}\sum_i (x_i - \bar{x})^2S2=n−11∑i
2020-07-30 20:47:55 13336
转载 《精益数据分析》笔记
什么是好的数据指标比较性的简单易懂的比率可改变、指导行为的找到正确的指标定性指标和量化指标虚荣指标和可付诸实践的指标需要提防的8个虚荣指标:点击量、PV、访问量、独立访客数、粉丝数、网站停留时间/浏览页数、收到的用户邮箱数、下载量探索性指标与报告性指标先见性指标和后见性指标相关性指标和因果性指标...
2020-07-29 19:47:54 1467
原创 满K叉树的叶子节点数有什么特点?
满 K 叉树中的节点要么是叶子结点,要么有 kkk 个子节点满 K 叉树的叶子结点数 mmm 满足:(m−1)%(k−1)=0(m-1) \% (k-1) = 0(m−1)%(k−1)=0以3叉树为例:容易观察:假设初始状态如蓝框所示,每当增加新的叶子节点,必然需要把一个叶子结点变成中间节点,再增加新的 kkk 个叶子结点,所以算下来新增了 k−1k-1k−1 个叶子结点。所以,满 kkk 叉树的叶子结点数 mmm 必然是如下等差数列的一项:k,2k−1,3k−2,…,k+n(k−1).
2020-07-27 13:44:02 3241
原创 pandas 筛选指定时间范围的数据
time_start = datetime(2020, 7, 23, 18) # 以 datetime 为索引,读取数据df = pd.read_csv(result_file0, index_col = 'datetime')# 将索引类型改成 DatetimeIndexdf.index = pd.DatetimeIndex(df.index)# 根据索引筛选df = df[df.index > time_start]...
2020-07-23 21:56:08 10363
原创 Thumbs.ms\com1.{d3e34b21-9d75-101a-8c3d-00aa001a1652}
市面上流通的插有SD卡的播放器产品,通常都有做加密:明明空间用了大半,打开文件夹却不显示现原形用 winrar 打开U盘路径里面原来是有东西的!而且主要内容在这么一个奇怪的路径下:E:\Thumbs.ms\com1.{d3e34b21-9d75-101a-8c3d-00aa001a1652}\ã..\LastF第一步,取消隐藏cmd 到 u 盘,执行attrib -s -r -h Thumbs.ms第二步,改文件名在 winrar 中改成正常路径,去掉非法字符接下来
2020-07-18 19:30:04 3952
原创 华为手机删除用户凭据(用于 WLAN)
一时激动在手机上安装了 Fiddler 安全证书,然后想删掉,发现居然找不到删除选项,真实尴尬!先找到对应的证书:设置 →\to→ 安全和隐私 →\to→ 更多安全设置 →\to→ 加密和凭据 →\to→ 用户凭据返回上一步,点击 “删除所有凭据”,不过放心,系统自带的证书是不会受影响的输入密码后,用户凭据已经清空,系统证书还在...
2020-07-18 11:06:51 11186 3
原创 SQL分组最大值
Employee 表包含所有员工信息,每个员工有其对应的 Id, salary 和 department Id。+----+-------+--------+--------------+| Id | Name | Salary | DepartmentId |+----+-------+--------+--------------+| 1 | Joe | 70000 | 1 || 2 | Henry | 80000 | 2 || 3
2020-07-15 18:41:15 1698
原创 mysql 实现 rank, dense_rank
编写一个 SQL 查询来实现分数排名。如果两个分数相同,则两个分数排名(Rank)相同。请注意,平分后的下一个名次应该是下一个连续的整数值。换句话说,名次之间不应该有“间隔”。+----+-------+| Id | Score |+----+-------+| 1 | 3.50 || 2 | 3.65 || 3 | 4.00 || 4 | 3.85 || 5 | 4.00 || 6 | 3.65 |+----+-------+例如,根据上述给定的 Scor
2020-07-15 17:24:51 1694
原创 SQL 分组排序的窗口函数 rank, dense_rank, row_number
建表create table score ( name varchar(20), subject varchar(20), score int );-- 2.插入测试数据 insert into score(name,subject,score) values('张三','语文',98);insert into score(name,subject,score) values('张三','数学',80);insert into score(name,subject,score) v
2020-07-15 16:21:08 1668
原创 SQL再谈分组topN
题目Employee 表包含所有员工信息,每个员工有其对应的工号 Id,姓名 Name,工资 Salary 和部门编号 DepartmentId 。+----+-------+--------+--------------+| Id | Name | Salary | DepartmentId |+----+-------+--------+--------------+| 1 | Joe | 85000 | 1 || 2 | Henry | 80000 |
2020-07-15 15:04:53 1409
原创 Excel 函数之 index + match
match返回查找元素在某一列中的位置:index返回某一列中某个位置的元素值index + match 实现组合查找
2020-07-14 22:53:35 1393
转载 几种常见的概率统计谬误
转载自:输出ING一、幸存者偏差描述关注于眼前那些经历了某些过程而幸存下来的人或物,却忽视了不在视线范围内的未幸存下来的人或物。举例二战中美国军方想加强飞机的防护,从而降低被敌军击落的几率。根据返航回来的飞机,可以看到弹孔主要分布于机翼和飞机尾部,而驾驶舱、发动机和油箱的弹孔则非常稀少。因为机翼和飞机尾部弹孔更多,军方认为应该加强这两个部位的防护。但给美国海军提供智囊顾问服务的沃德教授却提出了加强机身防护的建议,他认为:此次统计的样本,仅包含没有因敌火射击而坠毁并安全返航的轰炸机。
2020-07-14 22:13:44 3832
原创 Excel 函数之 vlookup
vlookup 的功能为匹配查找。VLOOKUP的公式:“=VLOOKUP(查找值,数据表,序列数,匹配条件[0,1])”通俗地讲,就是4个问题,“拿什么匹配”、“字典是那张表”、“字典中的第几列”、“精确查找0还是模糊查找1”。在单元格中输入“=VLOOKUP(”,然后用鼠标拖动选择查找值所在的单元格,接着用鼠标选取查找范围单元格,最后输入第三和第四个参数。输入时有两个小技巧,第一,先点击一个单元格,按“Ctrl +Shift + ↓”可以快速选中该单元格及之后的同一列的数据,按“Ctrl +Sh
2020-07-14 21:49:48 1641
原创 Excel 数组
文章目录数组表示利用数组计算公式利用数组调换列数组表示数组在Excel中用{}表示,下图中:选定区域输入数组ctrl+shift+enter利用数组计算公式不是简单的回车,而是ctrl+shift+enter利用数组调换列...
2020-07-14 21:40:44 1497
原创 SQL 分组计算 topN
首先安利这款免费在线 SQL 运行平台 sql fiddle:建表:create table score ( name varchar(20), subject varchar(20), score int );-- 2.插入测试数据 insert into score(name,subject,score) values('张三','语文',98);insert into score(name,subject,score) values('张三','数学',80);inse
2020-07-14 15:08:38 2810
转载 《增长黑客》笔记
在大多数软件公司或基于网络的公司,提高网站或App访客的激活和留存数量并不是由市场人员负责,而是由产品和工程团队负责,他们致力于开发能让用户爱上产品的功能。而这两个群体之间几乎不存在任何合作,他们各自专注于各自的重点工作,几乎没有什么互动。移动应用开发完成之后,市场团队制定了一个发布方案,像往常一样,这个方案包含了一系列传统的营销活动,并且重点放在了社交媒体、公关和付费获客推广上。App本身做得很好,营销方案也不错,但是用户增长仍然非常缓慢。最有可能成功的增长策略不是只关注用户群的扩大,也要最大限度.
2020-07-11 15:25:12 1341
转载 大数据/数仓面试灵魂30问(转)
1.什么是数据仓库?如何构建数据仓库?(如果这个问题回答的好,后面很多问题都不需要再问)2.如何建设数据中台?可简单说下理解与思路3.数据仓库、数据中台、数据湖的理解4.传统数仓的程度(建模工具、ETL工具、BI报表工具、调度系统)5.传统数仓和大数据数仓的异同?有哪些大的变化?6.印象最深刻的项目?为什么?亮点与优势?7.数仓最重要的是什么?8.实时数仓做过吗?采用什么架构?lambda有哪些优缺点?9.如何看待kappa架构?iota架构呢?10.责任心?沟通能力?团队协作?数据思维?
2020-07-09 14:01:13 2248
转载 学习笔记(3):大数据之Hive-连接查询
立即学习:https://edu.csdn.net/course/play/8005/164135?utm_source=blogtoedu建表create table customers(id int,name string,age int);insert into customers(id,name,age) values(1,'gxf',23);create table orders(id int,cid int,orderno int,price float);insert into or
2020-07-04 19:53:06 1354
转载 学习笔记(1):大数据之Hive-Hive安装配置和简单命令
立即学习:https://edu.csdn.net/course/play/8005/164128?utm_source=blogtoeduhive 架构1、 web ui、command line等2、 metaStore存放元数据3、 HQL ProcessEngine 把 sql 翻译成 MapReduce,编写 sql 代替 MapReduce 程序4、 Execution Engine 处理查询,生成结果5、 MapReduce 作为计算框架6、 hdfs/hbase 存储数据载体
2020-07-04 17:56:04 1356
转载 学习笔记(2):大数据之Hive-基本查询
立即学习: https://edu.csdn.net/course/play/8005/164134?utm_source=blogtoedu导出数据到目录create table test3 as select id,name from test2 where province='hebei' and city='baoding';--导出hive数据到本地目录(下载)insert overwrite local directory '/home/hadoop/hive' select * f
2020-07-04 17:50:55 1329
原创 HIVE SQL 实操
文章目录基本操作建表描述表,查看schema从文件导入数据hive 中执行 shell 命令hive 中执行 hdfs 命令拷贝表内部表和外部表内部表外部表分区表建表描述分区表载入数据到指定分区查询数据查看 hdfs分区表的查询模式: strict/nostrict查看有哪些分区增加分区修改表名移动分区的存储位置复制表基本操作建表show databases;show tables;create database mydb;create table if not exists mydb.
2020-07-04 11:55:21 1721
原创 Hive 安装
文章目录下载 hive:解压环境变量查看版本配置 hivehadoop下载 hive:wget http://archive.apache.org/dist/hive/hive-2.1.1/apache-hive-2.1.1-bin.tar.gz解压tar -xzvf apache-hive-2.1.1-bin.tar.gzmv apache-hive-2.1.1-bin hivemv hive /usr/local/环境变量vi /etc/profileexport HIVE_H
2020-07-03 22:05:41 1404
原创 敲黑板!数据分析师的基本素养
数据分析的五个关键环节界定问题:将原本简单的业务需求背后的原因挖掘出来收集数据:根据业务问题确定所需要的数据维度数据清洗:检查数据中存在的问题并进行处理数据可视化:通过可视化图表呈现数据的结构和关系数据建模:建立数据分析模型,对业务的发展进行评估与预测数据报告...
2020-07-02 16:26:25 1444
转载 如何写好一份数据分析报告?
作者:DataHunter链接:https://www.zhihu.com/question/39373532/answer/566222481 来源:知乎著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。文章目录一、 为什么要撰写数据分析报告二、数据分析报告是什么?三、数据分析报告的写作原则四、数据分析报告的种类1、专题分析报告2、综合分析报告3、日常数据通报五、数据分析报告的结构1、标题页2、目录3、前言4、正文5、结论与建议6、附录六、注意事项很多人在写数据分析报告的时候.
2020-07-01 20:22:00 2970
2024年3月杭州及周边小区挂牌价格
2024-03-22
利用 SIFT 实现图像拼接 python 代码
2021-01-01
python 使用摄像头监测心率
2020-10-14
知网爬虫.ipynb
2020-09-10
Python 图片中扭曲矩形的复原
2020-09-06
explore_data.ipynb
2020-05-20
Introduction to symmetry analysis (2002) [Brian J. Cantwell]
2020-01-07
Feedback Control in Systems Biology
2019-09-18
ICML 2019年 会议文章目录 (含论文下载链接)
2019-06-04
《应用非线性控制》【Slotine & Weiping Li 著】MIT经典教材
2019-01-05
Handbook of Matrices
2018-09-22
算法设计(英文文字版)by Jon_Kleinberg & Eva_Tardos
2018-09-19
icml 2018年 会议文章目录(含文章下载链接)
2018-09-17
link prediction in social networks: law of power distribution
2018-01-23
《Combinatorial Optimization》Cook, Cunningham, Pulleyblank, Schrijver
2017-11-14
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人