自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

yy的博客

大数据

  • 博客(17)
  • 资源 (22)
  • 问答 (2)
  • 收藏
  • 关注

原创 rdkit2019.09.1.0 python3.7 安装和使用

0 环境: python版本:python3.7 (anaconda) rdkit版本:2019.09.1.0 # 不同版本api不同 具体api参考官方文档 #从2019.03版本开始,RDKit不再支持Python2。如果需要继续使用Python 2,请坚持使用2018.09版本周期中的一个版本 pycharm:2019.03 ...

2019-12-24 23:56:19 3277

原创 python转换超大文本编码格式(gbk转utf8)

with open(r'C:\D\stj.txt',encoding='gbk', errors='ignore') as f: while True: res = f.read(102400) # 越大越快;过大会内存溢出报错 if res: open(r"C:\D\res",'a',encoding="utf8",erro...

2019-12-19 10:14:12 963

原创 漫步者 TWS1 win10 断音

声音断续问题:切换最下面 stereo就行

2019-12-14 11:21:54 2602 5

原创 hive 注释方法

-- 注释内容 切记 不要在注释内容里面写分号 ; 分号任何地方都识别 -- 该行后面均为注释内容

2019-12-12 20:30:50 4354

原创 hive 多个over最终结果按照最后一个分组排序来输出(顺序)

2019-12-12 20:29:30 545 1

原创 flink-redis连接器 pom文件

<dependency> <groupId>org.apache.bahir</groupId> <artifactId>flink-connector-redis_2.11</artifactId> <version>1.0</version&g...

2019-12-09 17:08:13 687

原创 flink pom.xml -尚硅谷b站-flink 1.7.2

https://www.bilibili.com/video/av77403752?p=6flink 1.7.2scala 2.11wordcount报错请导入 import org.apache.flink.streaming.api.scala._<?xml version="1.0" encoding="UTF-8"?><project xmlns...

2019-12-08 15:54:10 769

原创 spark-sql join 两个表字段名相同注意事项

2019-12-07 14:52:48 3525

原创 hvie sql 列转行

2019-12-05 22:37:53 126

原创 hive sql 行转列 concat_ws collect_set记忆

2019-12-05 22:28:58 252

原创 sql书写顺序-hive sql执行顺序-mysql执行顺序

2019-12-05 22:17:58 650

原创 hive join图解-和spark-sql对比

join // inner on a.id=b.id; 返回id编号的交集 行left join // outer on a.id=b.id; 返回a的所有id行;无匹配字段为nullright join // outer on a.id=b.id; 返回b的所有id行;无匹配字段为nullfull join ...

2019-12-05 22:07:11 420

原创 spark partitionby代码示例

package com.yyimport org.apache.spark.Partitionerimport org.apache.spark.sql.expressions.{Aggregator, MutableAggregationBuffer, UserDefinedAggregateFunction}import org.apache.spark.sql.types.{Do...

2019-12-04 20:25:52 691

原创 spark-dataframe转map字典

原数据:{"Make":"Honda","Model":"Pilot","RetailValue":32145.0,"Stock":4}{"Make":"Honda","Model":"Civic","RetailValue":19575.0,"Stock":11}{"Make":"Honda","Model":"Ridgeline","RetailValue":42870.0,"...

2019-12-04 11:18:05 4240

原创 spark sql UDAF-个人理解

存储为idea模板 使用时改吧改吧class MyUDAF extends UserDefinedAggregateFunction { // https://docs.databricks.com/spark/latest/spark-sql/udaf-scala.html // 1 输入数据的类型 // This is the input fields for ...

2019-12-03 16:41:32 227

原创 spark sql udf 两种写法用法

package com.yyimport org.apache.spark.sql.{DataFrame, Row, SparkSession}object CountPeopleInfo {// case class mydate(y: Int, m: Int, d: Int) extends Serializable def main(args: Array[String...

2019-12-03 15:07:21 366

原创 spark dataset 分组求极值

原始数据:+-----+---+| sex|age|+-----+---+|women| 35|| man| 3||women| 27|| man| 51||women| 34|| man| 26|| man| 49||women| 7|| man|119|| man|128||women|129||women| 41|| man| 33...

2019-12-03 00:14:44 257

hive-udf-处理JSON数组

hive_udf_处理JSON数组

2023-05-19

arm架构cpu oracle jdk8

arm架构cpu oracle jdk8

2022-12-04

scala-intellij-bin-2021.3.8.zip

idea scala插件

2021-11-07

matlab绘图方法.docx

matlab绘图方法.docx

2021-11-01

trino-363-server+client+jdbc.zip

trino363版本 server client 和 jdbc包

2021-10-29

jdk-11.0.12_windows-x64_bin-oracle.zip

jdk11 oracle官网

2021-10-29

jdk8-oracle.zip

jdk8 oracle官方

2021-10-29

zulu17.30.15-ca-jdk17.0.1-win_x64.zip

jdk17 zulu版本

2021-10-29

zulu11.52.13-ca-jdk11.0.13-win_x64.zip zulu版本

jdk11 zulu版本

2021-10-29

dbeaver-ee-21.2.0-win32.win32.x86_64.zip

dbeaver-ee-21.2.0-win32.win32.x86_64.zip

2021-10-29

有道云笔记Beta版-1.2.6.exe

有道云笔记Beta版-1.2.6.exe

2021-10-29

Xshell Plus.zip

xshell 带快速命令按钮 自用. 我是公司不让登录网盘,只能靠csdn...

2021-10-29

cdh继承tez引擎 cdh添加tez引擎 hive引擎增加

包括pom修改的每个截图和配置,该文档从有道云笔记到处略加修改,其中pom内容格式需要你手动调整一下. 富含 大量截图帮助定位和配置. 含hive on tez 常见报错的解决方法. tez比spark更省心. spark容易出现内存问题.

2021-07-07

天宝MN18(4800h)新版bios解决wsl蓝屏问题(2021年4月的bios)

天宝MN18(4800h)新版bios解决wsl蓝屏问题(2021年4月的bios)

2021-04-19

trino354不同内存参数比例性能对比.xlsx

描述trino的内存参数比例对查询速度的影响

2021-04-12

CloudCompareStereo_v2.12.alpha_setup_x64.exe

CloudCompare win安装包 2.12

2021-03-26

dbeaver.zip

企业版 7.3.0版本; 直接放到c盘根目录 解压到当前目录即可使用 解压后路径eg: C:\dbeaver\drivers\...

2021-02-18

redash-Version8.0.0-包含npm编译好的页面文件.zip

redash-Version8.0.0-包含npm编译好的页面文件

2021-01-29

Redash中文版V9安装部署1.28.pdf

Redash开源中文版V9.0.0安装部署培训教程

2021-01-28

dist.zip是redashV8.0.0dockr部署过程中npm产生的文件

redash v8.0.0的npm产生的文件夹 https://github.com/getredash/redash 使用方法:下载dist.zip 然后放到redish/client/下 然后运行 unzip dist.zip 然后cd .. 然后就ok了) 直接下载解压就行 否则需要npm去build

2021-01-28

excel 时间戳 日期时间 互转

excel 时间戳 日期时间 互转

2021-01-17

groupTable.js

在实现了单列合并的基础上实现了多列合并,并且右侧对应左侧的分组关系保留,并且不会改变分组内排序(所以需要后台把分组内数据提前排序)

2020-06-19

laydate.js

实现日期范文选择和纵向选择 即 选择每个月的周五等等 全局变量mydateold 就是当前选择的时间列表 使用官网的作为独立组件使用的方法

2019-09-29

许多点之间连线最短 python实现

https://blog.csdn.net/qq_35515661/article/details/86499957 许多点之间连线最短 python实现 网友给的公选课题目

2019-05-02

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除