- 博客(141)
- 资源 (1)
- 收藏
- 关注
原创 Python打包可执行文件
介绍如何使用CX_Freeze来对Python程序打包为可执行文件,从而在没有Python环境的Windows系统上运行
2024-11-13 09:01:05 662
原创 中文词向量质量的评估
本文介绍了对中文词向量的质量进行评估的方法,对腾讯,Jinaai,Text2Vec这三个主流的中文词向量模型的效果进行了综合评估,并采用CA8评测数据集进行了测试
2024-11-03 15:08:58 939
原创 通过SSL加密服务器流量
要实现通过SSL对客户端和服务器之间的流量进行加密,我们可以选择Stunnel这个开源软件,这个软件实现了客户端和服务器端之间的流量通过TLS进行加密传输。
2024-10-28 19:46:31 327
原创 Jetpack Compose开发一个Android WiFi信号测量应用
介绍了如何基于Jetpack compose开发一个Android WiFi信号测量的应用,以实现WIFI室内导航的功能。
2023-12-17 13:00:36 1207 2
原创 在Google Kubernetes集群创建分布式Jenkins(一)
介绍如何在Google云平台的Kubernetes集群上部署一个分布式的Jenkins cluster
2023-11-02 21:29:15 1094
原创 Google云平台构建数据ETL任务的最佳实践
介绍了Google云平台开发数据ETL任务的最佳实践,通过Dataflow来实现Kafka数据的定期批处理并写入到Bigquery
2023-10-14 22:00:43 763
原创 Google Data Fusion构建数据ETL任务
介绍了如何用Google的Data fusion云服务来创建一个数据的ETL Pipeline
2023-09-13 17:42:38 391
原创 用Google CDC来同步Cloud SQL的数据到Bigquery
介绍如何利用Google的Datastream来同步cloudsql的数据到bigquery
2023-09-05 17:26:34 880
原创 花费7元训练自己的GPT 2模型
基于Pytorch实现的GPT 2模型,包括了数据集准备,训练,文本生成的全过程,并在AutoDL单租用GPU进行训练
2023-08-01 14:20:02 4474 1
原创 Apache Beam构建批处理任务
平台需要定期生成车辆上报的里程信息,并汇总为小时、天、月等不同时间粒度的里程数据。车辆上报的里程消息将通过Kafka平台传递。平台收到里程消息之后,需要每个小时进行一次处理,剔除异常的里程数据,计算每小时车辆的行驶里程。车辆的ETL消息和每小时的里程数据将保存为Parquet文件,以节省费用。},
2023-05-28 10:53:06 1077
原创 用Pagerank算法来解决用户分类问题
基于Spark和Hadoop,介绍如何应用Pagerank算法来解决二分图类型的问题,详细讲述了对一个用户日志数据进行用户分类的实际问题的解决方案
2023-05-15 07:17:59 404
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人