自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(11)
  • 收藏
  • 关注

原创 excel批量生成ddl(笨方法)

excel批量生成建表语句,这个方法还有点笨,还需要手动再调整,如果大家有更好的方法,欢迎大家补充。

2023-08-16 10:58:48 268

原创 sql 临时表使用

sql 临时表

2022-08-04 17:18:44 119 1

原创 数据清洗--yyyy-MM-dd hh:mm:ss.0 格式转化为yyyy-MM-dd hh:mm:ss

yyyy-MM-dd hh:mm:ss.0 格式转化为yyyy-MM-dd hh:mm:ss总结:共有三种方法,但具体使用场景受限。1、regexp_replace函数trim(regexp_replace(列名,'\\.0', ' ')) as new_l列名.容易被转义,前面加两个\可以防止被转移。2、replace函数另外hive里没有replace函数,否则也可以使用此函数。trim(replace(列名,'.0', ' '))as new_列名 3、translate函数t

2022-05-23 15:14:42 385

原创 JavaSE基础知识总结(个人学习笔记)

发展史1990年是sun公司的一个项目,1994年改名为java,现属于oracle公司。Java版本javaSE:standard edition,标准版,桌面软件,桌游。javaME:移动版,发展不怎么好,被Android用了然后带飞了。javaEE:企业版,一般用其做大型系统,大型网站。java优点一次编写,处处运行,在不同系统上安装java虚拟机(JVM)即可使用,且jvm不跨平台,各个系统都可以使用。所以java是跨平台语言。java相关工具认识JDK:java develo

2021-11-03 18:09:47 205

原创 java继承中set/get方法说明

2021-11-01 22:40:58 403

原创 2021-06-26

hive 中导入数据中含中文 出现乱码解决代码如下:use zyy;create table if not exists major(id string comment '学号',name string comment '姓名',origin string comment '籍贯',hobby string comment '爱好')row format delimited fields terminated by '\t';load data local inpath '/root/

2021-06-26 13:02:07 55

转载 pip一直安装selenium失败

pip一直安装selenium失败解决办法:此处选择了清华的镜像pipinstallselenium-ihttps://pypi.tuna.tsinghua.edu.cn/simple参考:https://blog.csdn.net/tiantushuai8766/article/details/104451220?utm_medium=distribute.pc_relevant.none-task-blog-BlogCommendFromMachineLearnPa...

2020-11-27 21:40:57 384

原创 简单爬取图片

#基础版爬取一个图片import requestspath="D:/abc.jpg"url="http://img0.dili360.com/ga/M01/48/3C/wKgBy1kj49qAMVd7ADKmuZ9jug8377.tub.jpg@!rw9"r=requests.get(url)print(r.status_code)with open(path,'wb') as f: f.write(r.content) f.close() import os

2020-11-18 22:43:58 181

原创 简单爬取网页实战1

#正常的爬取一个商品的网页import requestsurl="https://item.jd.com/100005929301.html"try: r=requests.get(url) #获取url链接 r.raise_for_status() #requests里的一个函数,可以捕捉错误 r.encoding=r.apparent_encoding #赋值状态码 print(r.text[:10000])except: print("爬取失败")

2020-11-12 22:43:15 256

原创 爬取网页通用代码框架

爬取网页通用代码框架import requestsurl="https://item.jd.com/100005929301.html"try: r=requests.get(url) #获取url链接 r.raise_for_status() #requests里的一个函数,可以捕捉错误 r.encoding=r.apparent_encoding #赋值状态码 print(r.text[:10000])except: print("爬取失败") .

2020-11-12 21:16:07 102

原创 数据结构结点问题

每个结点都应包括两个部分:一个是需要用的实际数据data;另一个就是存储下一个结点地址的指针,即数据域和指针域。数据结构中的每一个数据结点对应于一个存储单元,这种储存单元称为储存结点,也可简称结点。...

2020-03-10 11:01:17 452

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除