自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

Today_2018的博客

那勇往直前永不言弃的意志就是希望

  • 博客(118)
  • 资源 (2)
  • 收藏
  • 关注

原创 Tmux 实用教程

tmux 使用教程

2023-05-15 16:38:08 696 1

原创 windows10 杀掉一个端口

-

2022-08-11 13:43:21 3819

原创 牛客sql_全部题目

SQL1查找最晚入职员工的所有信息select *from employeeswhere hire_date = (select max(hire_date) from employees)SQL2查找入职员工时间排名倒数第三的员工所有信息select emp_no ,birth_date ,first_name ,last_name ,gender ,hire_date from ( select * ,dense_rank

2022-03-15 16:42:59 1049

原创 牛客sql_非技术快速入门

SQL23 统计每个学校各难度的用户平均刷题数解法:SELECT u.`university`,d.`difficult_level`,COUNT(1)/COUNT(DISTINCT u.`device_id`)FROM user_profile uLEFT JOIN question_practice_detail q ON u.`device_id`=q.`device_id`LEFT JOIN question_detail d ON q.`question_id`=d.`questio

2022-03-15 16:42:29 187

原创 牛客sql_大厂面试真题

SQL1 各个视频的平均完播率select video_id ,round(sum(if(timestampdiff(second,start_time,end_time)>=duration,1,0))/count(1),3) avg_comp_play_ratefrom tb_video_infoleft join tb_user_video_log using(video_id)where year(start_time)='2021'group by video_id

2022-03-15 16:38:37 3174

原创 牛客sql_SQL进阶挑战

做题方法:对于难度较大的题目,建议采用三步走的方法第一步:看懂题目,了解需求,看一下别人的代码,理解思路第二步:自己基本上能够把代码写下来,但是还存在一定的问题第三部:能够完整无错误写出代码SQL1 插入记录(一)注解1、insert into…values 如果要插入多行,指令是 values ,…多行之间用逗号隔开;2、Auto Increment类型的列,在插入时用null/default关键字补位,在插入时sql会自动计算各行应有的值;3、interval 时间间隔关键字,常和d

2022-03-15 16:38:04 368

原创 牛客sql_SQL必知必会

SQL1 从 Customers 表中检索所有的 IDselect cust_idfrom CustomersSQL2 检索并列出已订购产品的清单select distinct prod_idfrom OrderItemsSQL3 检索所有列select cust_id,cust_namefrom Customers where cust_id like 'a%'SQL4 检索顾客名称并且排序select cust_namefrom Customersorder by

2022-03-15 16:37:12 996

原创 牛客Shell篇

SHELL1统计文件的行数awk '{print NR}' nowcoder.txt | tail -n1SHELL2打印文件的最后5行tail -n5SHELL3输出7的倍数#!/bin/bashfor i in {0..500}doif [[ i%7 -eq 0 ]]then echo $ifidoneSHELL4输出第5行的内容head nowcoder.txt -n5 | tail -n1SHELL5打印空行的行号awk '{if($0==""){pri

2022-03-15 16:36:41 310

原创 Leetcode数据库

175. 组合两个表select FirstName,LastName,City,Statefrom Personleft join Address using(PersonId)176. 第二高的薪水select ( select distinct salary from Employee order by salary desc limit 1,1) as SecondHighestSalary177. 第N高的薪水CREATE FUNCTION

2022-03-15 16:35:56 579

原创 Leetcode_shell编程

192 统计词频cat words.txt | tr -s ' ' '\n'|sort | uniq -c | sort -r | awk '{print $2" "$1}':<<!cat ——浏览文件tr -s ——替换字符串(空格换为换行)保证了一行一个单词sort ——默认ASCII值排序,排序号后还会有重复uniq —— 去重,-c再输出重复次数。结果就是 ”4 abc“ abc出现了4次sort -r —— 反向排序,也就是从大到小。得到按频率高低的结果awk —

2022-03-15 16:34:49 174

原创 Hive优化---or

优化前select count(b.user_initial_ccid)from dwd.dwd_ccid_register_a aleft join audience_data_service.sys_user_all b on ((b.user_id=a.union_id_md5 and b.user_type_id=15)or (b.user_id=a.mobile_md5 and b.user_type_id=16)or (b.user_id=a.email_md5 and b.use

2022-02-24 13:40:40 1137

原创 leetcode刷题技巧

给大家分享一个我刷500道力扣的经验:1.一道题定时刷,比如超过半小时做不出来就看答案;2.不要用轮子,比如很多题用python的包一句话就能解决,这时候尝试自己写;3.关注时间与空间复杂度,尽量掌握最优解法;4.如果自己写出了双百的解法,可以输出成题解,教大于学。我的刷题思路就是 先把题目刷了,有一定的数量和基础之后,通过输出倒逼输入,写总结和Blog,把类型相同的归纳在一起,形成自己的套路。...

2022-02-17 19:29:54 725

原创 牛客sql_SQL进阶挑战

做题方法:对于难度较大的题目,建议采用三步走的方法第一步:看懂题目,了解需求,看一下别人的代码,理解思路第二步:自己基本上能够把代码写下来,但是还存在一定的问题第三步:能够完整无错误写出代码SQL1 插入记录(一)注解1、insert into…values 如果要插入多行,指令是 values ,…多行之间用逗号隔开;2、Auto Increment类型的列,在插入时用null/default关键字补位,在插入时sql会自动计算各行应有的值;3、interval 时间间隔关键.

2022-02-15 19:43:31 870

原创 sql----窗口函数

窗口函数和普通聚合函数也很容易混淆,二者区别如下:聚合函数是将多条记录聚合为一条;而窗口函数是每条记录都会执行,有几条记录执行完还是几条。聚合函数也可以用于窗口函数中MySQL从8.0开始支持窗口函数,这个功能在大多商业数据库和部分开源数据库中早已支持,有的也叫分析函数。...

2022-02-11 16:26:57 438

原创 牛客SQL----非技术快速入门

SQL1 查询多列select device_id,gender,age,universityfrom user_profile;SQL2 查询所有列SELECT *from user_profile; SQL3 查询结果去重SELECT DISTINCT universityfrom user_profile; SQL4 查询结果限制返回行数SELECT device_idFROM user_profilelimit 0,2;SQL5 将查询后的列重新命名SELECT

2022-02-08 22:51:16 714

原创 程序员电脑软件清单

1、火绒安全火绒安全是一款电脑安全软件,简洁无广告,也没有各种附加捆绑的组件,只有纯粹的电脑防护功能。除了基础的病毒、系统和网络防护以外,我认为它最强大的功能就是可以对软件安装进行监控和拦截。https://www.huorong.cn/person5.html2、Geek Uninstaller说到软件管理,当然少不了软件的卸载。想要卸载软件其实很简单,打开开始菜单,右键点击任意一款软件,选择【卸载】功能,就可以进入所有程序的卸载管理界面了。这是一款很强大的卸载工具,个人版是完全免费的。它

2022-01-20 19:04:17 604

原创 Mysql 语句执行顺序

一、Mysql 语法顺序select[distinct] from join(如left join) on where group by having union order by limit二、Mysql执行顺序from on join where group by having select distinct union order by 注:1)使用distinct要写在所有要查询字段的前面,后面有几个字段,就代表

2022-01-19 15:47:22 6181

原创 对象存储服务----OSS

一、什么是OSS?「OSS」的英文全称是Object Storage Service,翻译成中文就是「对象存储服务」,官方一点解释就是对象存储是一种使用HTTP API存储和检索非结构化数据和元数据对象的工具。白话文解释就是将系统所要用的文件上传到云硬盘上,该云硬盘提供了文件下载、上传等一列服务,这样的服务以及技术可以统称为OSS,业内提供OSS服务的厂商很多,知名常用且成规模的蓝队云等。二、OSS相关的术语1.存储空间(Bucket)存储空间是您用于存储对象(Object)的容器,所有的对象都

2022-01-19 14:19:33 5612

原创 数据分层----ODS,DWD,DWS,ADS,DIM

数据分层相关概念:零、数据加载层:ETL(Extract-Transform-Load)一、数据仓库层:DW(Data Warehouse)操作数据层:ODS(Operational Data Store)数据明细层:DWD(Data Warehouse Detail)数据汇总层:DWS(Data WareHouse Summary)应用数据层:ADS(Application Data Store)通用维度层:DIM(Dimension)推荐阅读:https://www.cnblogs

2022-01-19 11:48:01 4927

原创 CentOS7 yum方式安装MySQL5.7

在CentOS7中默认安装有MariaDB,这个是MySQL的分支,但为了需要,还是要在系统中安装MySQL,而且安装完成之后可以直接覆盖掉MariaDB。1、下载并安装MySQL官方的 yum Repository[root@iZ438zoehjmenpZ ~]# wget -i -c http://dev.mysql.com/get/mysql57-community-release-el7-10.noarch.rpm2、安装MySQL服务器。安装完成后就会覆盖掉之前的mariadb。[ro

2022-01-18 12:13:11 403

原创 本地工具连接远程数据库mysql--1130错误

当本地工具尝试连接服务器的时候,如果出现无法连接的情况,可能是权限没有开。首先显示Mysql数据库:mysql> show databases;进入mysql数据库mysql> use mysql;找到user表,mysql>show tables对Host授权任意用户即可。mysql>update user set Host = '%' where User='root';...

2022-01-18 11:55:46 617

原创 心脏病预测-----集成学习xgboost

一、问题背景利用集成学习xgboost实现心脏病预测。二、数据集分析数据集地址:https://www.kaggle.com/ronitf/heart-disease-uci数据集中一共有303个样本,共有14个特征,特征描述如下:属性含义age年龄sex性别 1=male,0=femalecp胸痛类型(4种) 值1:典型心绞痛,值2:非典型心绞痛,值3:非心绞痛,值4:无症状trestbps静息血压chol血清胆固醇fbs空腹血糖

2022-01-08 10:44:40 724 1

原创 java 实现凯撒密码

密文–>明文import java.util.Scanner;// 向左移动3位public class Demo { public static void main(String[] args) { System.out.println("请输入密文:"); Scanner input = new Scanner(System.in); String str = input.next(); byte[] byteArra

2021-11-26 16:54:30 1306

原创 数据预处理 -----数据分箱

一、定义数据分箱(Binning)作为数据预处理的一部分,也被称为离散分箱或数据分段。其实分箱的概念其实很好理解,它的本质上就是把数据进行分组。分箱就是把数据按特定的规则进行分组,实现数据的离散化,增强数据稳定性,减少过拟合风险。逻辑回归中进行分箱是非常必要的,其他树模型可以不进行分箱。二、分箱原因在建立逻辑回归模型的过程中,基本都会对特征进行分箱的操作。有些树模型,虽然不是必须,也会对一些特征进行一些分箱,这里主要的原因是增强鲁棒性与避免过拟合。[外链图片转存失败,源站可能有防盗链机制,建议

2021-06-23 09:42:20 10106 2

原创 箱线图中的计算及python绘图

一、定义箱形图(英文:Box plot),又称为盒须图、盒式图、盒状图或箱线图,是一种用作显示一组数据分散情况资料的统计图。因型状如箱子而得名。在各种领域也经常被使用,常见于品质管理,快速识别异常值。箱形图最大的优点就是不受异常值的影响,能够准确稳定地描绘出数据的离散分布情况,同时也利于数据的清洗。二、五大因“数”我们一组序列数为例:12,15,17,19,20,23,25,28,30,33,34,35,36,37讲解这五大因“数”1、下四分位数Q1(1)确定四分位数的位置。Qi所在位置=

2021-06-23 08:54:05 6917 1

原创 python 员工信息管理系统

python 员工信息管理系统# -*- coding: utf-8 -*-import sqlite3from typing import Listclass employeeManagerSystem(object): def __init__(self): # 连接数据库 test.db, 如果不存在就创建 self.conn = sqlite3.connect('test.db') # 定义操作数据库的 cursor()

2021-06-08 15:22:24 956 3

原创 基于python中sqlite和tkinter的GUI学生管理系统

基于python中sqlite和tkinter的GUI学生管理系统import tkinterimport tkinter.messageboximport tkinter.ttkimport sqlite3# 创建tkinter应用程序from tkinter import ttkroot = tkinter.Tk()# 设置窗口标题root.title('学生信息管理系统V1.0')# 定义窗口初始大小root['height'] = 500root['width'] = 3

2021-06-08 15:13:46 4189 12

原创 关联分析(Apriori算法 )---- python

关联分析(Apriori算法 )假设我们经营一家商品种类并不多的杂货店,我们对那些经常在一起被购买的商品组合感兴趣。设(1)通过Apriori算法实现从交易记录中找到商品的频繁项集。(2)通过(1)中计算的频繁项集,挖掘关联规则设交易清单为[1, 3, 4], [2, 3, 5], [1, 2, 3, 5], [2, 5],这里的数字代表商品;设最小支持度为0.5;最小置信度为0.7#1)通过Apriori算法实现从交易记录中找到商品的频繁项集def loadDataSet(): re

2021-06-07 18:50:36 706 1

原创 常见数据结构代码实现 ----python

无序表查找算法简介顺序查找又称为线性查找,是一种最简单的查找方法。适用于线性表的顺序存储结构和链式存储结构。该算法的时间复杂度为O(n)。基本思路从第一个元素m开始逐个与需要查找的元素x进行比较,当比较到元素值相同(即m=x)时返回元素m的下标,如果比较到最后都没有找到,则返回-1。优缺点缺点:是当n 很大时,平均查找长度较大,效率低;优点:是对表中数据元素的存储没有要求。另外,对于线性链表,只能进行顺序查找。算法实现# 最基础的遍历无序列表的查找算法# 时间复杂度O(n) def

2021-06-07 08:55:01 103

原创 农夫渡河问题 ----python

一农夫带着一头狼,一只羊和一担草过河,小船只能一次装载农夫和一样货物,狼会吃羊,羊会吃草,只有农夫在时才安全。现欲让所有物品包括农夫都安全过道河对岸,使用程序实现求解。name = ["farmer", "wolf", "sheep", "grass"]scheme_count = 0# 完成局面def is_done(status): return status[0] and status[1] and status[2] and status[3]# 生成下一个局面的所有情况.

2021-06-06 20:59:29 738

原创 主仆渡河问题 ----python

主仆渡河问题只有一艘船,三个商人三个仆人过河,每一次船仅且能坐1~2个人,而且任何一边河岸上仆人比商人多的时候,仆人会杀人越货。#允许状态集合,例num=3#S={(x,y)|x=0,y=0,1,2,3;x=3,y=0,1,2,3;x=y=1,2} x是此岸的商人数,y是此岸的仆人数#允许决策集合,例 boat_limit=2#D={(u,v)|1<=u+v<=2,u,v=0,1,2} u是撘载的商人数,v是搭载的仆人数# 设置决策状态集合变量,允许决策集合限制变量num=3

2021-06-06 20:57:54 622

原创 基于LCIS数据集的决策树与逻辑回归模型对比

基于LCIS数据集的决策树与逻辑回归模型对比1、读取数据# 导入相关的包import numpy as npimport pandas as pdimport matplotlib.pyplot as pltimport seaborn as sns# 设置绘图的字体plt.rcParams['font.sans-serif']=['SimHei']\#这两句作用为防止中文乱码【;plt.rcParams['axes.unicode_minus']=False# 导入数据data

2021-06-01 17:19:35 296

原创 python tkinter GUI案例----新生报到采集程序

import tkinterimport tkinter.messageboximport tkinter.ttk# 创建tkinter应用程序root = tkinter.Tk()# 设置窗口标题root.title('新生报到采集程序')# 定义窗口初始大小root['height'] = 450root['width'] = 350# 在窗口上创建标签组件labelName = tkinter.Label(root, te

2021-06-01 10:52:23 455

原创 python tkinter GUI案例----模拟用户登录(三次不成功推出)

import tkinterimport tkinter.messageboximport osimport os.pathpath = os.getenv('temp')filename = os.path.join(path, 'info.txt')# 创建应用程序窗口root = tkinter.Tk()# 在窗口上创建标签组件labelName = tkinter.Label(root,\ text='User Name:'

2021-06-01 10:47:05 362

原创 pandas 练习题

(1)请计算每一年宫颈癌患病百分比,每一年龄段的宫颈癌患病百分比,并将结果到ratioUS.csv中import pandas as pddeathUS = pd.read_csv(r'C:\Users\David\Desktop\deathUS.csv')populationUS = pd.read_csv(r'C:\Users\David\Desktop\populationUS.csv')ratioUS = pd.DataFrame()for indexs in deathUS.colu

2021-05-29 15:09:59 411

原创 numpy 练习题

1、生成长度为8的数组,范围在0-1之间,不包括0和1import randomdef number(): ''' Returns 返回范围在0-1之间,不包括0和1的一个数 ------- TYPE DESCRIPTION. ''' a = random.random() if a > 0: return a else: return number()b = [nu

2021-05-29 14:44:23 270 1

原创 乳腺癌2002~2018城市和乡村个年龄段患病率曲线图绘制 ---pyechart

1、数据集(请保存为csv文件)year,20-24years,25-29years,30-34years,35-39years,40-44years,45-49years,50-54years,55-59years,60-64years,65-69years,70-74years,75-79years,80-84years,85-89years2002,0.16,0.46,1.23,1.6,2.3,5.35,6.25,6.71,8.39,12.67,11.75,16.5,20.74,7.462003

2021-05-29 14:38:39 781

原创 python 字符串练习题

1、完成带时间统计的单行进度条import timescale = 50print('执行开始'.center(scale//2,"-"))start = time.perf_counter()for i in range(1,scale+1): a = '#' * i b = '.' * (scale-i) c = (i/scale) * 100 dur = time.perf_counter() -start print("\r{:^3.0f}%[{}-

2021-05-29 14:30:17 1790 1

原创 统计实验方法相关实验

import numpy as npimport pandas as pddf = pd.read_csv(r'C:\Users\David\Desktop\上课\健康数据挖掘\第三次作业\diabetes.csv')df.head()# 查看数据的信息df.info()# 查看数据的分布情况tmp = df.describe()print(tmp)# matploblib and seaborn import matplotlib.pyplot as pltimport se

2021-05-29 14:10:16 93

原创 numpy 初步理解

1,生成长度为8的数组,范围在0-1之间,不包括0和1import numpy as np np.random.random(8) 2,生成5*5的ndarray对象,模拟游戏界面,矩阵边界全为1,里面全为0,import numpy as npa= np.zeros((5,5), dtype =int)print(a)print("-------------------------------")a[0,:]=1a[:,4]=1a[:,0]=1a[4,:]=1print(a)

2021-05-17 14:14:56 130

hbase-1.2.0-cdh5.10.0.tar.gz

大数据开发过程中所要用到的安装包Hbase,这个安装包是CDH公司的产品。HBase是一个分布式的、面向列的开源数据库,该技术来源于 Fay Chang 所撰写的Google论文“Bigtable:一个结构化数据的分布式存储系统”。

2020-03-15

hadoop-2.6.0-cdh5.10.0.tar.gz

Apache Hadoop 2.6.0-cdh5.10.1是2.x.y发行版中的次要发行版,它建立在先前的稳定版本2.4.1的基础上。

2020-03-15

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除