Thomas2143-CSDN博客

原创 scikit-learn pipeline做数据预处理模板参考

pipeline制定每个字段预处理逻辑.pipeline对训练数据进行预处理转换pipeline对测试数据即新数据进行预处理转换。

2025-09-15 14:15:31 247

原创 macos deepctr_torch虚拟环境配置

背景:conda安装pytorch deepctr-torch存在冲突,无法运行起来.下面是成功的方案,vscode中终端执行即可.

2025-09-09 14:49:54 450

原创 deepfm 手动实现数据格式小白可看

【代码】deepfm 手动实现数据格式小白可看。

2025-09-02 13:46:36 82

原创吉利银河L6 23款曼牌型号记录

空气滤清器即发动机空气滤芯 C40043。机滤 w7153(是w7056的升级版)空调滤芯 CUK25055。为方便购买特此记录。

2025-08-29 15:05:14 166

原创推荐系统中用户和商品embedding的理解

/ 极简代码入门可参考主要是理解embedding的训练流程和使用流程.embedding的训练介绍.不同的目标可以训练出不同的embedding表.我们以 user1 购买 item 评分则为1,否则为0通过交互记录,实现embedding层的数据训练:embedding层的参数矩阵即用户/商品向量矩阵embedding的推理本质就是查表操作。

2025-08-22 11:45:25 365

原创推荐系统召回双塔模型模型训练耗时对比测试

【代码】推荐系统召回双塔模型模型训练耗时对比测试。

2025-07-30 00:44:26 63

原创 pyspark driver 上传pod本地文件到对象存储

前提: pyspark driver on k8s,环境变量或者spark_home/jars 下有相关对象存储的包,报错包问题就这里添加jar即可。

2025-06-30 11:26:41 254

原创 macos 卸载docker app

点击三个点点击Trobleshoot 点击uninstall。

2025-05-30 10:05:03 324

原创 python 房贷计算器组合贷支持配置每年提前还款金额

目前市面上房贷计算器都不支持配置提前还款金额,而且很多不显示每月还款中多少是本金多少是还的利息我这里统统有。

2025-05-22 11:21:27 165

原创 jetbrains idea 配置快捷键 macos cmd+上下箭头移动光标到文本顶部/底部

2025-04-29 18:24:11 165

原创 scala schedular 后台调度代码demo

比如flink中定期后台更新小维表到内存中。

2025-04-29 18:04:33 81

环境a训练模型环境b推理模型包版本对比a环境:b环境:Model TiDE failed to predict with the following exceptionOSError: /usr/local/lib/python3.11/site-packages/torchaudio/lib/libtorchaudio.so: undefined symbol: _ZNK5torch8autograd4Node4nameB5cxx11EvFollowing models failed to predic

2025-04-27 10:56:19 300

原创 mermaid绘制神经网络

【代码】mermaid绘制神经网络。

2025-03-19 18:27:35 325

原创 aws sagemaker 启动/创建 pipeline报错

ClientError: An error occurred (ValidationException) when calling the CreatePipeline operation: Unable to parse pipeline definition. Property 'null' with value 'null' is not of expected type 'String'

2025-03-13 15:31:54 241

原创 autogluon做时间序列推理报错 “RuntimeError: Following models failed to predict: [‘RecursiveTabular‘, ‘Weighted

时间序列的格式不对我这里是时间序列的时间长度太短. 训练集正常,推理时候出现了短时间序列的id.

2025-03-06 17:59:50 238

原创 jupyterhub on k8s 配置用户名密码 + 自定义镜像

如果只是小组内使用不想共用密码也不想搞复杂认证方案那么就直接通过map(用户名,密码md5值)来制定密码。

2025-02-24 11:58:37 353 1

原创 aws sagemaker api 获取/删除 endpoints

【代码】aws sagemaker api 获取/删除 endpoints。

2025-01-23 10:55:04 403 1

原创 python 关闭 sagemaker 日志美化

公司凭条不支持日志美化中的颜色显示,会显示乱码比如:其中很多符号都是颜色等.

2025-01-20 11:17:33 297

原创 macos arm 本地/docker/本地k8s 安装jupyterhub 并登陆

编辑生成的配置文件: jupyterhub_config.py。修改这两个常见容易冲突的port即可。

2025-01-16 10:47:24 645 3

原创 pandas df.groupby 效果

【代码】pandas df.groupby 效果。

2024-12-20 11:29:00 244

原创 jupyter notebook 模型命令行传参

sys.argv = ['当前notebook文件名字.ipynb','--key1','value1','--key2','value2']

2024-12-12 10:11:53 213

原创 spark sql flatten 展开双层数组的内存数组

spark-sql (default)> select flatten(array(array(11,22),array(22,33)));flatten(array(array(11, 22), array(22, 33)))[11,22,22,33]

2024-12-04 17:53:07 243

原创 paimon表做flink维表实时join

【代码】paimon表做flink维表实时join。

2024-12-04 11:32:21 569

原创 flink sql function array_contains demo

【代码】flink sql function array_contains demo。

2024-12-03 14:24:20 195

原创 macos python绘图 matplotlib 中文表头不显示/乱码问题

【代码】macos python绘图 matplotlib 中文表头不显示/乱码问题。

2024-11-20 17:55:30 256

原创 flink datastream table 混用报错 Cannot have more than one execute() or executeAsync() call in a single e

Cannot have more than one execute() or executeAsync() call in a single environment

2024-11-05 14:57:55 169

原创 paimon0.9 主键表的之 changelog producer 笔记

paimon解决-U的的方式是增加normalize算子,存储老数据再state中,比对后可补齐-U,所以成本高可配置 scan.remove-normalize 取消,同时导致没-U。如果没关闭normalize算子,先发-U(小王,18,100) 再发+U(小王,18,300) 那么结果就是 18,(103-100+300)=303 这才是正确值.normalize算子开启(flink state存老数据注意ttl要永久,否则部分-U也会丢): sink: +I -U +U -D。

2024-09-27 18:19:56 388

原创 scalatest 之数组 contains

【代码】scalatest 之数组 contains。

2024-09-25 14:01:04 298

原创 scalatest之参数化测试

【代码】scalatest之参数化测试。

2024-09-25 13:49:55 150

原创 scalatest scalamock 之 mock案例

【代码】scalatest scalamock 之 mock案例。

2024-09-25 13:46:18 387

原创 scalatest 实战 expects onCall 指定参数限制制定参数和返回值关系

【代码】scalatest 实战 expects onCall 指定参数限制制定参数和返回值关系。

2024-09-25 11:54:45 142 1

原创 fastjson2 解决long类型带L尾缀的value

/ 数组L 替换为数字但是字符串中的不能替换。

2024-09-11 15:39:46 454

原创 jdbc报错 Caused by: com.mysql.cj.jdbc.exceptions.CommunicationsException: The last packet successfully

• validationQuery=SELECT 1：执行简单的 SQL 查询来测试连接。• testOnBorrow=true：每次获取连接时测试连接是否有效。

2024-09-10 18:15:52 851

原创 flink程序官方测试工具 scala版本本地亲测

udf测试 flinkc程序测试。

2024-09-10 14:53:52 362 1

原创 flink1.18.0 试用谷歌云 checkpoint报错:com.google.common.collect.ImmutableMap$Builder.buildOrThrow()

基础镜像: https://hub.docker.com/_/flink/tags?flink 开始做checkpoint写入google云存就会触发报错。升级到flink1.18.1。

2024-09-09 14:20:55 219 1

原创 flink udf 返回多列 demo

【代码】flink udf 返回多列 demo。

2024-09-04 18:34:34 348

原创 20240830顺风车乘客端价格对比

2024-08-30 02:39:39 316

原创吉利银河L6 第二年保险出险对保费的影响

出险一次自己责任自己修车走车损,1000多元;给对方修车走交强险,1000多元.导致保费上涨1100左右. 车损,三者等项目都上涨注意:如果出险流程没走完(不会导致第二年报价上涨),恰好可以买第二年保险(保险到期前一个月),如果你买了,这次出险没给你加钱,会在第二年给你加上............. 可以钻漏洞第二年换保险公司。

2024-08-28 20:34:16 841

matlab绘图方法.docx

2021-11-01

cdh继承tez引擎 cdh添加tez引擎 hive引擎增加

包括pom修改的每个截图和配置,该文档从有道云笔记到处略加修改,其中pom内容格式需要你手动调整一下. 富含大量截图帮助定位和配置. 含hive on tez 常见报错的解决方法. tez比spark更省心. spark容易出现内存问题.

2021-07-07

Redash中文版V9安装部署1.28.pdf

Redash开源中文版V9.0.0安装部署培训教程

2021-01-28

hive-udf-处理JSON数组

hive_udf_处理JSON数组

2023-05-19

arm架构cpu oracle jdk8

2022-12-04

CloudCompareStereo_v2.12.alpha_setup_x64.exe

CloudCompare win安装包 2.12

2021-03-26

trino354不同内存参数比例性能对比.xlsx

描述trino的内存参数比例对查询速度的影响

2021-04-12

scala-intellij-bin-2021.3.8.zip

idea scala插件

2021-11-07

Xshell Plus.zip

xshell 带快速命令按钮自用. 我是公司不让登录网盘,只能靠csdn...

2021-10-29

有道云笔记Beta版-1.2.6.exe

2021-10-29

dbeaver-ee-21.2.0-win32.win32.x86_64.zip

2021-10-29

zulu11.52.13-ca-jdk11.0.13-win_x64.zip zulu版本

jdk11 zulu版本

2021-10-29

zulu17.30.15-ca-jdk17.0.1-win_x64.zip

jdk17 zulu版本

2021-10-29

jdk8-oracle.zip

jdk8 oracle官方

2021-10-29

jdk-11.0.12_windows-x64_bin-oracle.zip

jdk11 oracle官网

2021-10-29

trino-363-server+client+jdbc.zip

trino363版本 server client 和 jdbc包

2021-10-29

许多点之间连线最短 python实现

https://blog.csdn.net/qq_35515661/article/details/86499957 许多点之间连线最短 python实现网友给的公选课题目

2019-05-02

redash-Version8.0.0-包含npm编译好的页面文件.zip

redash-Version8.0.0-包含npm编译好的页面文件

2021-01-29

天宝MN18(4800h)新版bios解决wsl蓝屏问题(2021年4月的bios)

2021-04-19

dist.zip是redashV8.0.0dockr部署过程中npm产生的文件

redash v8.0.0的npm产生的文件夹 https://github.com/getredash/redash 使用方法：下载dist.zip 然后放到redish/client/下然后运行 unzip dist.zip 然后cd .. 然后就ok了) 直接下载解压就行否则需要npm去build

2021-01-28

excel 时间戳日期时间互转

2021-01-17

dbeaver.zip

企业版 7.3.0版本; 直接放到c盘根目录解压到当前目录即可使用解压后路径eg: C:\dbeaver\drivers\...

2021-02-18

laydate.js

实现日期范文选择和纵向选择即选择每个月的周五等等全局变量mydateold 就是当前选择的时间列表使用官网的作为独立组件使用的方法

2019-09-29

groupTable.js

在实现了单列合并的基础上实现了多列合并,并且右侧对应左侧的分组关系保留,并且不会改变分组内排序(所以需要后台把分组内数据提前排序)

2020-06-19

presto开启https配置好后无法成功启动

2021-01-15

idea的git插件里面的auto fetch有啥用,有什么存在的必要?能方便我们什么?

2020-12-24

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

matlab绘图方法.docx

cdh继承tez引擎 cdh添加tez引擎 hive引擎增加

Redash中文版V9安装部署1.28.pdf

hive-udf-处理JSON数组

arm架构cpu oracle jdk8

CloudCompareStereo_v2.12.alpha_setup_x64.exe

trino354不同内存参数比例性能对比.xlsx

scala-intellij-bin-2021.3.8.zip

Xshell Plus.zip

有道云笔记Beta版-1.2.6.exe

dbeaver-ee-21.2.0-win32.win32.x86_64.zip

zulu11.52.13-ca-jdk11.0.13-win_x64.zip zulu版本

zulu17.30.15-ca-jdk17.0.1-win_x64.zip

jdk8-oracle.zip

jdk-11.0.12_windows-x64_bin-oracle.zip

trino-363-server+client+jdbc.zip

许多点之间连线最短 python实现

redash-Version8.0.0-包含npm编译好的页面文件.zip

天宝MN18(4800h)新版bios解决wsl蓝屏问题(2021年4月的bios)

dist.zip是redashV8.0.0dockr部署过程中npm产生的文件

excel 时间戳 日期时间 互转

dbeaver.zip

laydate.js

groupTable.js

presto开启https配置好后无法成功启动

idea的git插件里面的auto fetch有啥用,有什么存在的必要?能方便我们什么?

excel 时间戳日期时间互转