自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(159)
  • 资源 (1)
  • 收藏
  • 关注

原创 力扣算法20题:有效的括号

匹配括号

2022-08-31 18:05:45 333 1

原创 Python编程入门--第九章 类

python中的类

2022-08-17 22:13:30 1823

原创 牛客SQL大厂面试真题:SQL3 每类视频近一个月的转发量/率

编程代码select b.tag ,sum(a.if_retweet) as retweet_cut ,round(sum(a.if_retweet)/count(a.id),3) as retweet_ratefrom tb_user_video_log as a join tb_video_info as b using (video_id) where datediff((select max(end_time) from tb_user_video_log)

2022-04-04 11:05:12 694

原创 数据采集实战:某feed流产品的数据采集历程

业务背景明确需求评论数和点赞数对用户点击有没有促进?可先进行埋点,后续进行分析埋点事件确定确定埋点事件属性拆解各事件:想看下拉几次和间隔时长,判断用户的依赖程度,和加载相同触发时机属性来源展示时长,需要弄一个计时器?和研发商量加载次数存在哪里比较合适?时长=结束时间-开始时间,分别从哪取比较合适?与RD沟通时长后一个时间戳的确定:前一个时间戳来自API,后一个自然来自API比较合理细节确认:单日的定义为自然日数据检验发现的坑:1)“卡片展现”、“卡片点击”的

2022-03-14 18:39:10 632

原创 latex公式排版指南

**在线latex公式编辑器网址:**https://www.latexlive.com/home##三种输入方式中,图片识别最快,但是带文本的部分公式可能识别不了,需手动输入可在输出区域查看排版的公式效果

2022-02-28 15:57:32 278

原创 latex图排版指南

::::ABS SCALAR BIGINT ABS(BIGINT arg0),DECIMAL(?,?) ABS(DECIMAL(?,?) arg0),INT ABS(INT arg0),DOUBLE ABS(DOUBLE arg0)::::ACOS SCALAR DOUBLE ACOS(DECIMAL(?,?) arg0),DOUBLE ACOS(DOUBLE arg0)::::ADD_MONTHS SCALAR STRING ADD_MONTHS(DATE arg0, BIGIN

2022-02-28 15:20:11 491

原创 latex表格排版指南

\begin{table}[H]\begin{center}\caption{商城资源池信息详情表}\label{mall-info}\vspace{2mm}\setlength{\tabcolsep}{7mm}{\resizebox{.9999\columnwidth}{!}{ %缩小表格高度\begin{tabular}{p{3.5cm} p{3cm} p{5.7cm}}\hline字段名称 & 释义 & 备注

2022-02-28 11:49:37 2683

原创 python将数据写入mysql

将以数字命名的文档批量插入mysql数据库import pandas as pdfor i in range(1,24): data_info = pd.read_csv("文档地址"+str(i)+".csv") # utf8格式 from sqlalchemy import create_engine engine = create_engine('mysql+mysqldb://用户名:密码@主机名:端口号/业务库?charset=utf8') #将数据写入sql

2022-01-06 14:24:20 1310

原创 数据库-表情符号正确插入时,数据库需要改的格式

以下字段全改成utf8格式

2022-01-05 13:36:27 408

转载 pandas神坑:如果列有NAN,则默认给数据转换为float类型

今天碰到一个错误,一个字典取值报keyError, 一查看key, 字符串类型的数字后面多了小数点0, 变成了float的样子了。发现了pandas一个坑:如果列有NAN,则默认给数据转换为float类型!来源:https://stackoverflow.com/questions/39666308/pd-read-csv-by-default-treats-integers-like-floats但是,我们这里不想要让它转成float, pandas中有dtype指定列的数据类型,我们可以在read

2022-01-05 13:27:28 1445

原创 superset时间区间设置总结

2021-11-18 13:54:58 1879

原创 SQL实战83:牛客的课程订单分析(七)

题目解答with tmp as (select user_id,count(*) as cntfrom order_infowhere date > "2025-10-15"and product_name in ("C++","Java","Python")and status = "completed"group by user_idhaving cnt >= 2 )select if(t.name is null,"GroupBuy",t.name) as sour

2021-09-01 10:01:56 118

原创 SQL实战82. 牛客的课程订单分析(六)

题目解答with tmp as (select user_id,count(*) as cntfrom order_infowhere date > "2025-10-15"and product_name in ("C++","Java","Python")and status = "completed"group by user_idhaving cnt >= 2 )select o.id,o.is_group_buy,c.namefrom order_info a

2021-09-01 09:51:50 73

转载 距离公式详解

   在做分类时常常需要估算不同样本之间的相似性度量(SimilarityMeasurement),这时通常采用的方法就是计算样本间的“距离”(Distance)。采用什么样的方法计算距离是很讲究,甚至关系到分类的正确与否。  本文的目的就是对常用的相似性度量作一个总结。目录1. 欧氏距离(EuclideanDistance)2. 曼哈顿距离(ManhattanDistance)3. 切比雪夫距离 ( Chebyshev Distance )4. 闵可夫斯基距离(MinkowskiDistance)

2021-08-18 14:46:00 2458

原创 推荐系统实战学习笔记—(一) 好的推荐系统

信息过载问题的解决方案发展史#mermaid-svg-MgWS6WT5IlD8xXmk .label{font-family:'trebuchet ms', verdana, arial;font-family:var(--mermaid-font-family);fill:#333;color:#333}#mermaid-svg-MgWS6WT5IlD8xXmk .label text{fill:#333}#mermaid-svg-MgWS6WT5IlD8xXmk .node rect,#mermaid

2021-08-05 16:13:57 226

原创 python 列表:字符串变浮点型 数据框架类型转变

数字字符串列表 ——> 数字浮点型列表a = ['2', '3.5', '10', '88', '32.66']b =list(map(float, a))print(b)[2.0, 3.5, 10.0, 88.0, 32.66]

2021-08-05 14:27:08 409

原创 ODPS SQL筛选空字符串和空值

筛选空值where column.name is null筛选非空值where column.name is not null筛选空字符串where LENGTH(trim(column.name)) = 0筛选非空字符串where LENGTH(trim(column.name)) > 0筛选非空值且非空字符串where column.name is not nulland LENGTH(trim(column.name)) > 0...

2021-08-04 10:08:09 2685

原创 python实现TF-IDF

corpus = [ 'This is the first document.', 'This document is the second document.', 'And this is the third one.', 'Is this the first document?']from sklearn.feature_extraction.text import TfidfVectorizerimport pandas as pdtfidf = TfidfVectorizer()

2021-07-17 23:03:17 229

转载 十大经典排序算法--python实现

简介冒泡排序(Bubble Sort)是一种简单直观的排序算法。它重复地走访过要排序的数列,一次比较两个元素,如果他们的顺序错误就把他们交换过来。走访数列的工作是重复地进行直到没有再需要交换,也就是说该数列已经排序完成。这个算法的名字由来是因为越小的元素会经由交换慢慢"浮"到数列的顶端。算法描述比较相邻的元素。如果第一个比第二个大,就交换它们两个;对每一对相邻元素作同样的工作,从开始第一对到结尾的最后一对,这样在最后的元素应该会是最大的数;针对所有的元素重复以上的步骤,除了最后一个;重复步骤1

2021-06-22 18:21:50 200

原创 力扣算法题3:无重复的最长子串

题目代码法一:class Solution: def lengthOfLongestSubstring(self, s: str) -> int: # 哈希集合,记录每个字符是否出现过 occ = set() n = len(s) # 右指针,初始值为 -1,相当于我们在字符串的左边界的左侧,还没有开始移动 rk, ans = -1, 0 for i in range(n):

2021-06-22 17:12:58 98

原创 数仓导入维表注意事项

1、除了时间没有其他类型,不需要导入框架SELECT a.date_id ,nvl(b.income_count,0)FROM dim_date a LEFT JOIN ( SELECT day_id ,sum(income_count) as income_count FROM dwd_income_channel_df GROUP BY day_id ) b ON a.d

2021-06-11 17:47:28 90 1

原创 精确到天的月环比—利用参数

CREATE TABLE IF NOT EXISTS ads_mon_ratio_df( current_date string COMMENT '当前日期', current_month_income bigint COMMENT '当前月截止昨天累计收入', current_month_income_ratio DECIMAL COMMENT "收入月份环比") COMMENT '收入-月环比统计表'

2021-06-11 13:33:33 234

原创 SQL:将表中一列拆成两列

计算tableA表中type列有两种类型,计算每个id的每种类型的count和 id type count 1 1 10 2 2 5 1 1 8 4 2 9方法:select id ,sum(case when type=1 then count end) as income ,s

2021-06-09 14:46:03 2657

原创 Python中lambda函数的使用方法

在进行编程时,一般我们会给一个函数或者变量起一个名字,该名称是用于引用或寻址函数变量。但是有一个低调的函数,你不需要赋予它名字,因此该函数也叫匿名函数。该函数就是Python中的Lambda函数,下面就来为大家解析lambda函数的基本使用方法。为什么要使用Python Lambda函数?匿名函数可以在程序中任何需要的地方使用,但是这个函数只能使用一次,即一次性的。因此Python Lambda函数也称为丢弃函数,它可以与其他预定义函数(如filter(),map()等)一起使用。相对于我们定义的可重复

2021-06-09 12:23:31 1486

原创 mysql数据库如何查询表中所有字段名,快速select

1.查看全部select * from information_schema.columns where table_name="表名" and table_schema="数据库名";2、以逗号连接,直接可用select group_concat(COLUMN_NAME) from information_schema.columns where table_name="表名" and table_schema="数据库名";...

2021-05-06 18:53:13 2224 2

原创 EXCEL、navicate数据库如何选中多行,且不用鼠标拖拽

1、打开表2、先选中起始行3、按住键盘的Shift键4、拖动右侧的滚动条5、选中终止行6、松开键盘的Shift键

2021-05-06 18:26:58 2067

原创 如何更新一张表的某一列,使其与另一张表对应

文章目录一、update二、update join一、updateUPDATE tableA a,tableB b set a.corporation_id = b.company_id, a.corporation_name = b.company_name, a.brand_id = b.brand_id, a.brand_name = b.brand_name, a.series_id = b.series_id, a.series_name = b.series_nam

2021-05-06 17:37:49 689

原创 SQL实战91.获得积分最多的人(三)

题目解答with tmp as ( select a.user_id, a.cnt as add_num ,if(b.cnt is null,0,b.cnt) as reduce_num from (select user_id,sum(grade_num) as cnt from grade_info where type = "add" gro

2021-04-14 23:29:45 574

原创 SQL实战90.获得积分最多的人(二)

题目解答select b.user_id as id,c.name,b.cntfrom ( select a.user_id,a.cnt,rank() over (order by a.cnt desc) as ranking from ( select user_id,sum(grade_num) as cnt from grade_info where type = "add" g

2021-04-14 23:09:48 334

原创 SQL实战88.最差是第几名(二)

题目解答当某一数的正序和逆序的累计均大于等于整个序列的数字个数的一半即为中位数select grade from (select grade,(select sum(number) from class_grade) as total, sum(number) over(order by grade) a, sum(number) over(order by grade desc) b from class_grade) t1where a >

2021-04-14 22:51:05 221

原创 SQL实战86.实习广场投递简历分析(三)

题目解答select a.job, a.mon as first_year_mon,a.cnt as first_year_cnt,b.mon as second_year_mon,b.cnt as second_year_cnt from ( select job,date_format(date,"%Y-%m") as mon,sum(num) as cnt from resume_info where date_format(date,"%Y") = "202

2021-04-13 22:58:19 171

原创 SQL实战80 牛客的课程订单分析(四)

题目解答select user_id,min(date) as first_buy_date,count(user_id) as cntfrom order_infowhere date > "2025-10-15"and status = "completed"and product_name in ("C++","Java","Python")group by user_idhaving count(user_id) > 1order by user_id;...

2021-04-07 22:48:31 149

原创 SQL实战81. 牛客的课程订单分析(五)

题目解答with tmp as ( select user_id,min(date) as first_buy_date,count(user_id) as cnt from order_info where date > "2025-10-15" and status = "completed" and product_name in ("C++","Java","Pytho

2021-04-07 22:42:21 259

原创 SQL实战84 实习广场投递简历分析(一)

题目select job,sum(num) as cntfrom resume_infowhere date between "2025-01-01" and "2025-12-31"group by joborder by sum(num) desc;

2021-04-05 19:42:53 169

原创 SQL实战70.牛客每个人最近的登录日期(五)

题目解答SELECT a.date,ROUND(COUNT(DISTINCT login.user_id)/ COUNT(a.user_id),3) AS pFROM ( -- 找到每天的新用户 SELECT user_id,MIN(date) AS date FROM login GROUP BY user_id) AS a -- 和原表login联结的条件也容易出错,这里要根据用户id和日期两个条件来进行联结-- 日期的限定条件那里不能使用where,如果使用

2020-12-06 22:09:42 181

原创 SQL实战76.考试分数(五)

题目解答select B.* from(SELECT job,FLOOR((COUNT(*)+1)/2) AS `start`,FLOOR((COUNT(*)+1)/2)+if(COUNT(*) % 2=1,0,1) AS `end` FROM grade GROUP BY job) A -- 中位数的位置信息,也就是升序之后的排名信息JOIN(select g1.*, (select count(distinct g2.score) from grade g2

2020-12-06 16:19:45 200

原创 SQL实战26.汇总各个部门当前员工的title类型的分配数目

题目解答刚开始写的代码缺少group by行代码,通不过测试,看讨论可知:需要将dept_no作为分组条件才行, 因为不同部门,包含了不同title,首先是根据部门分组,然后同一部分再根据title分组。select d.dept_no,d.dept_name,t.title,count(t.title) as "count"from titles as t join dept_emp as de on t.emp_no=de.emp_no join depar

2020-12-05 21:38:55 387

原创 SQL实战67.牛客每个人最近的登录日期(二)

题目解答select u.name u_n,c.name c_n,l.date d from login l inner join (select user_id,max(date) max from login group by user_id) ton l.user_id = t.user_id and l.date = t.maxinner join user u on l.user_id = u.id inner join client c on l.client_id = c.id

2020-12-05 17:23:09 148

原创 SQL实战61.对于employees表中,给出奇数行的first_name

题目解答自写答案,通不过测试,看讨论的原因是没有考虑到“输出的结果不需排序”,觉得此理由行不通,因为不需排序包含排序情况,更应该能通过测试。select t.first_namefrom(select e.first_name,row_number () over (order by first_name ) as rankingfrom employees as e) as twhere mod(t.ranking,2)=1指正答案:select e.first_namefrom

2020-12-05 16:03:32 441

原创 SQL实战41.构造一个触发器audit_log,在向employees表中插入一条数据的时候,触发插入相关的数据到audit中

题目解答知识补充主要借鉴的是MySQL数据库触发器讲解与案例在MySQL中,创建触发器语法如下:CREATE TRIGGER trigger_name trigger_time trigger_event ON tbl_name FOR EACH ROWtrigger_stmt其中:trigger_name:标识触发器名称,用户自行指定;trigger_time:标识触发时机,取值为 BEFORE 或 AFTER;trigger_event:标识触发事件,取值为 INSERT、UP

2020-12-05 11:30:55 1119

SQL基础教程示例代码.rar

本文件是根据SQL基础教程书中的示例代码自输入的代码,运行的软件是SQL server,在文件中加入了注解,在注解中亦提出了自己的想法和见解,不仅可以当SQL的代码文件用,而且可以充当书本或课件。

2020-05-31

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除