自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

Lindsay的博客

数据分析之路

  • 博客(20)
  • 收藏
  • 关注

原创 如何从DataFrame中提取年、月、日、时、分以及Python时间相关函数

这里写自定义目录标题如何将DataFrame中Object类型的字段转换成datetime类型(pandas)如何从DataFrame时间字段中提取年、月、日、时、分(pandas)datetime模块如何将DataFrame中Object类型的字段转换成datetime类型(pandas)使用pandas模块中的to_datetime函数:df['date1'] = pd.to_datetime(df['date1'],format='%Y-%m-%d')如何从DataFrame时间字段中提取年

2021-09-15 13:38:33 10504 2

原创 Python读取exce文件报错AttributeError: ‘MergedCell‘ object attribute ‘value‘ is read-only

Python读取exce文件报错AttributeError: ‘MergedCell’ object attribute ‘value’ is read-only。如果确定不是脚本问题,可能是excel文件的问题,原因是单元格不能合并,(可能是宏影响,建议开启所有宏)

2020-11-13 18:56:09 3539

转载 给PostgreSQL添加MySQL的unix_timestamp与from_unixtime函数

MySQL的2个常用函数unix_timestamp()与from_unixtime PostgreSQL并不提供,但通过PostgreSQL强大的扩展性可以轻松的解决问题。话说远在天边,尽在眼前,文档看仔细,问题迎仞解。PostgreSQL 题供extract与date_part取epoch即可即unix_timestamp() = round(date_part(’epoch’,now()))from_unixtime(int) = to_timestamp(int)添加函数unix_time

2020-09-24 15:29:43 2832

原创 聊聊Hive的那些事儿

本文仅仅从宏观上去聊聊Hive中的一些常见问题。文末我整理了几篇其他人的文章,个人感觉对自己的学习起到了作用。有兴趣的同学可以点过去阅读。1. Hive是什么?Hive是基于Hadoop的一个数据仓库工具,用来进行数据提取、转化、加载,这是一种可以存储、查询和分析存储在Hadoop中的大规模数据的机制。hive数据仓库工具能将结构化的数据文件映射为一张数据库表,并提供SQL查询功能,能将SQL...

2020-04-22 17:27:41 259

原创 MySQL中limit和offset的用法详解(力扣原题:获取第二高的薪水,第N高的薪水)

limit和offset用法mysql里分页一般用limit来实现:select* from article LIMIT 1,3select * from article LIMIT 3 OFFSET 1上面两种写法都表示取2,3,4三条条数据。当limit后面跟两个参数的时候,第一个数表示要跳过的数量,后一位表示要取的数量,例如:select* from article LIMI...

2020-04-16 10:40:04 665

原创 力扣第601题:体育馆的人流量(延伸:获取连续登陆天数、连续签到天数等)

一、力扣原题:体育馆的人流量题目来源:力扣(LeetCode)链接:https://leetcode-cn.com/problems/human-traffic-of-stadium以下是力扣原题:X 市建了一个新的体育馆,每日人流量信息被记录在这三列信息中:序号 (id)、日期 (visit_date)、 人流量 (people)。请编写一个查询语句,找出人流量的高峰期。高峰期时,至少...

2020-04-15 16:08:58 1011 3

原创 (十)统计表速查(标准正态分布、t分布、卡方分布)

《深入浅出统计学》-读书笔记 第10篇1、标准正态分布续表:2、t分布3、卡方分布

2020-04-14 09:45:31 25744 2

原创 (九)正文未及的十大拓展

《深入浅出统计学》-读书笔记 第9篇本文内容: 正文未及的十大拓展

2020-04-14 09:40:05 101

原创 (八)相关关系与回归关系的区别与联系?

《深入浅出统计学》-读书笔记 第8篇本文内容: 第15章 相关与回归:我的线条如何?

2020-04-13 16:04:03 1677

原创 (七)卡方检验之拟合优度检验与独立性检验

《深入浅出统计学》-读书笔记 第7篇本文内容: 第14章 卡方分布:继续探讨

2020-04-13 11:30:41 3735

原创 (六)置信区间与假设检验详解

本文内容: 第12章 置信区间的构建:自信地猜测 第13章 假设检验的运用:研究证据

2020-04-10 16:27:02 3911

原创 (五)如何进行统计抽样?样本与总体参数如何估计?

本文内容: 第10章 统计抽样的运用 抽取样本 第11章 总体与样本的估计 进行预测

2020-04-09 17:28:26 749

原创 (二)一图了解数据的集中趋势、分散性与变异性度量的指标

标题《深入浅出统计学》读书笔记 第2篇本文内容: 第2章 集中趋势的量度:中庸之道 第3章 分散性与变异性的度量:强大的“距”

2020-04-08 23:42:28 1442

原创 (一)统计学中的图形有哪些?

标题信息图形化,第一印象

2020-04-08 23:40:46 2663

原创 超全干货 I 43个Excel函数,数据分析必备!

本文根据公众号文章《超全干货 I 43个Excel函数,数据分析必备!》整理,并对部分excel函数补充了示例,以方便理解!可作为日常数据分析工作中的速查手册。参考文章:超全干货 I 43个Excel函数,数据分析必备!...

2020-04-08 23:22:16 463

原创 (四)排列组合与常见的概率分布——二项分布、几何分布、泊松分布、正态分布

本读书笔记的内容: 第6章 排列与组合:排序、排位、排 第7章 几何分布、二项分布及泊松分布(离散) 第8章 正态分布的运用:保持正态 第9章 再谈正态分布的运用:超越正态...

2020-04-08 18:39:51 1010

原创 (三)简单易懂的概率分布、期望与方差

本读书笔记的内容: 第4章 概率计算:把我机会 第5章 离散概率的应用:善用期望

2020-04-08 18:27:58 409

原创 PostgreSQL单列多行变一行&一行变多行

工作中经常遇到这样一个场景,希望将某个字断查询出得结果组合成为一个字符串,用逗号分割(或者分号),通过PG中的函数该如何实现?实例表:想要的结果:方法一:string_agg(字段名,分隔符)select id,string_agg(name,',') AS NAME_NEW from testgroup by 1ORDER BY 1方法二:array_agg(字段名)sel...

2020-04-08 15:05:25 4611

转载 Postgresql窗口函数

窗口函数源文档(PostgreSQL 9.3.1 中文手册)窗口函数后必需跟着一个over子句。一、聚合函数作为窗口函数任何内建的或自定义的聚合函数都可以作为窗口函数,仅当调用跟着OVER子句的聚合函数,作为窗口函数;否则它们作为常规的聚合。推荐看下面这个文档,讲得通俗易懂。Postgresql窗口函数(一)通用窗口函数推荐看下面这个文档,讲得通俗易懂。Postgresql窗口...

2020-03-04 14:39:46 364

原创 利用Python进行数据归一化

快速进入利用Python进行数据归一化**归一化化定义:**归一化就是要把需要处理的数据经过处理后(通过某种算法)限制在你需要的一定范围内。归一化方法有两种形式:一种是把数变为(0,1)之间的小数一种是把有量纲表达式变为无量纲表达式一、归一到[0,1]class sklearn.preprocessing.MinMaxScaler(feature_range=(0, 1),c...

2020-01-08 16:09:35 41742 4

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除