- 博客(323)
- 资源 (6)
- 收藏
- 关注
原创 Llama3.0论文学习笔记: The Llama 3 Herd of Models
今天分享Llama3.0的论文,2024.7月来自Meta的Llama团队,2025年1月DeepSeek R1出现之后,其风头显然已经盖住了Llama3,这时候整理Llama3感觉有点赶不上潮流了,但是我还是想整理下Llama3.0,原因是刚好春节的时候读了下原论文(起源是节后在公司做分享),另外一个是Llama3的技术比较成熟,很多大模型的语言部分都是Llama的架构,因此想做为入门大模型的第一个实践模型。Llama3的技术报告也是长达94页,读完之后,还是有一种醍醐灌顶的感觉,里面还是写了非常多干货的
2025-02-16 18:59:34
469
1
原创 《编写可读代码的艺术》读书笔记
借着春节放假的几天, 读了下《编写可读代码的艺术》这本书, 这本书不是很长,主要关注代码的一些编写细节,比如方法命名,函数命名,语句组织,任务分解等, 旨在让写的代码更加鲁棒,便于维护以及便于让别人理解。写的还是很不错的,所以这边文章整理一些不错的编码细节。
2025-02-01 23:24:11
849
原创 自动驾驶之DriveMM: All-in-One Large Multimodal Model for Autonomous Driving
多模态模型(LMM)结合大语言模型(LMM),在自动驾驶(AutonomousDriving,AD)领域展现出色的理解和解释能力。但是当前数据驱动的AD方法往往集中在单个数据集和特定任务上,忽视整体和泛化能力。为了弥补这些差距,本文提出了提出了一体化LMM,DriveMM,一个通用的大型多模态模型,该模型接收多样化的数据输入,例如图像和多视角视频,旨在有效处理AD中的各种驾驶场景和任务,比如感知、预测和规划等。
2025-01-19 18:19:48
1780
原创 LLM动手实践(一): 微调google的bert和vit模型完成文本和图片的分类任务
最近大模型比较火热,也正好在公司开始接触这块相关的业务,大模型是未来的趋势,对于研发工程师来讲,是powerful的效能工具,所以想沉淀一些大模型实践相关的笔记来记录自己在使用大模型产品,部署开源大模型解决实际问题或需求,以及fine-tune大模型实现某个功能过程中的所思和所想
2024-08-04 17:18:07
1470
原创 Python学习笔记(二):函数
这几周从实践角度又学习了一遍python,温故而知新,还是有蛮多心得的, 周末再看之前记的python笔记,总觉得零零散散, 未成体系,所以后面这段时间,陆续**对之前的python笔记做一次整合, 使得内容更加清晰,成体系,做到简单可依赖**,既是复习,也方便以后回看回练。希望能帮助到更多的伙伴啦。这是第二篇文章,主要整理python函数相关的内容,函数初识到高级特性再到函数式编程,层层递进。既有基础,又有新知识,这样更有意思一些
2024-07-07 09:37:31
978
原创 Python学习笔记(一):基础特性
这几周从实践角度又学习了一遍python,温故而知新,还是有蛮多心得的, 周末再看之前记的python笔记,总觉得零零散散, 未成体系,所以后面这段时间,陆续**对之前的python笔记做一次整合, 使得内容更加清晰,成体系,做到简单可依赖**,既是复习,也方便以后回看回练。希望能帮助到更多的伙伴啦。这是第一篇文章,主要整理python的基础特性,数据类型(字符串,列表,字典等)、运算符、流程控制等,既有基础,又有新知识,这样更有意思一些。
2024-06-30 11:14:08
653
原创 Python学习笔记(四): 异常处理和文件操作
开发人员在编写程序时,难免会遇到错误,有的是编写人员疏忽造成的语法错误,有的是程序内部隐含逻辑问题造成的数据错误,还有的是程序运行时与系统的规则冲突造成的系统错误,等等。
2024-06-17 20:18:51
1463
原创 Python学习笔记(五): 模块和包
这次是从实践的再去补充python的相关内容,目的是要写出漂亮的python代码,增强代码的可读,可维护,灵活和高效,方便调试和监控
2024-06-10 16:53:19
809
原创 Go语言系统学习笔记(三):杂项篇
公司的新业务开发需要用到go语言,虽然之前没接触过这门语言,但在大模型的帮助下,边看项目边写代码也能进行go的项目开发,不过,写了一段时间代码之后,总感觉对go语言本身,我的知识体系里面并没有一个比较完整的架子,学习到的知识零零散散,不成体系,虽然能完成工作,但心里比较虚,没有沉淀下知识。所以, 也便于后续知识的扩充与回看。此次学习,依然是业余时间看文档的方式搭建知识框架(工作之后发现看视频比较慢,没时间看), 参看的文档是, 上面内容整理的很详细,非常适合初学者搭建知识体系。
2024-05-10 10:06:36
1069
1
原创 Go语言系统学习笔记(一):基础篇
公司的新业务开发需要用到go语言,虽然之前没接触过这门语言,但在大模型的帮助下,边看项目边写代码也能进行go的项目开发,不过,写了一段时间代码之后,总感觉对go语言本身,我的知识体系里面并没有一个比较完整的架子,学习到的知识零零散散,不成体系,虽然能完成工作,但心里比较虚,没有沉淀下知识。所以想借着这个机会,用两周的时间系统的学习下go语言, 在知识体系里面搭一个属于go语言的知识框架,把知识拎起来, 也便于后续知识的扩充与回看
2024-05-07 16:32:12
1365
2
原创 AES和RSA加解密算法学习笔记(实战版)
今天整理一篇有关密码学的学习笔记,原因是最近做的一个任务是在网络传输的时候,需要对传输的包进行加密和解密工作,以保证传输过程的安全性。所以,这个过程用到了AES和RSA两个算法。场景:假设我要给我的老师传送毕设代码和论文, 我已经把代码和论文打成了一个压缩包,我想把这个压缩包通过微信发过去。首先,我对压缩包先用AES算法加密,得到压缩包的密文其次,我把AES算法的密钥,再通过RSA算法加密, 得到密钥的密文。
2024-04-22 21:33:56
1062
原创 LLM推理框架Triton Inference Server学习笔记(二): Triton模型部署流程(stey by stey)
上一篇文章对triton inference server进行了一个整体的介绍,解答了三个经典问题what, why, how。这篇文章就开始转入实践, 从实践的角度整理Triton模型部署的全流程, 如果我有一个训练好的模型了,究竟如何部署到triton server,并提供服务给到客户端, 客户端发请求之后,怎么把数据推理得到结果等。这篇文章, 会对这些问题做出解答。Triton模型部署概览模型仓库准备模型配置文件编写Triton Server启动TritonServer客户端访问。
2024-04-14 17:27:16
3193
3
原创 Python向带有SSL/TSL认证服务器发送网络请求小实践(附并发http请求实现asyncio+aiohttp)
最近工作中遇到这样的一个场景:给客户发送文件的时候,为保证整个过程中,文件不会被篡改,需要在发送文件之间, 对发送的文件进行签名, 而整个签名系统是另外一个团队做的, 提供了一个接口服务完成签名,但访问这个接口需要提供他们团队提供的证书链先进行认证,所以需要和该服务端建立安全的链路,这里是用ssl双向认证的方式实现。本篇文章主要是记录下如果是用Python给这种ssl双向认证的服务器发送post请求的时候,应该怎样携带证书去双向认证?
2024-04-03 21:20:27
1229
原创 LLM推理框架Triton Inference Server学习笔记(一): Triton Inference Server整体架构初识
这篇文章开始进行大语言模型(Large Language Model, LLM)的学习笔记整理,这次想从Triton Inference Server框架开始,因为最近工作上用到了一些大模型部署方面的知识, 所以就快速补充了些,大模型这块, 属于是从用户使用触发,先把模型部署上来, 把整个业务流程走顺,让用户先能用起来,然后再深入到模型本身的细节中去哈哈。Triton Inference Server是Nvida开源的机器学习推理引擎,提供了非常多实用的功能帮助我们快速落地AI模型到生产环境以提供业务使用。
2024-03-11 20:41:37
4093
原创 《小狗钱钱》读书笔记
今天整理的一本书叫《小狗钱钱》,作者是有”欧洲巴菲特”之称的博多舍费尔,这是一本儿童教育的财商启蒙书,舍费尔用生动的金钱童话,将看似复杂的财富法则一一拆解,引导我们在实际生活中操作,以轻松有取的方式教我们如何变得富有。
2024-02-25 23:24:17
1588
原创 MongoDB学习笔记
最近工作用到了Mongodb,虽然有了gpt,对于这种数据库操作的代码基本上不用自己费多大功夫,但对于知识本身,还是想借机会系统学习下Mongodb的,原因是之前接触数据库一直都是mysql,oracle等关系型数据库,对于非关系型数据库,这还是第一次接触,另外,就是写代码的时候,也不想总是问gpt, 毕竟,所以,抽出了几天的时间系统学习一下mongodb,,本篇文章就是,本次教程主要参考两个网站。
2024-02-22 22:17:35
1359
原创 Python重温笔记番外篇
1. 写在前面今天这篇文章整理一波python的高频面试题了, 正好借着这个机会把前面的知识进行一个串联, 要不然这些知识很容易就会遗忘, 毕竟知识多而又不太容易常用到。 涉及到的知识包括列表推导式, 高阶函数的使用, 字典排序, 字符串, 日期, 文件遍历, 生成器, 正则, 线程等, 所以还是比较全面的, 以后如果再遇到python方面的练习题的话, 也可以再进行相应的补充。整理完这篇之后, python全栈学习的python部分就基本差不多结束, 无非后面还会有两到三个的小插曲, 接下来就是pyt
2024-01-04 14:53:04
1210
原创 C++11的新特性大总结
1. 写在前面这段时间, 差不多把C++的基础内容重新过了一遍,后面会利用零碎的时间,再把一些C++的重要新内容给过一下, 因为随着时代的发展, C++也与时俱进, 迭代更新, 这个过程中可绕不开C++11的标准,这个可以看做是C++的一次重大升级,其实这个我还是在实习期间接触的,在之前,我对C++的认识,依然是停留在老版本上,直到实习的时候,看到自动类型推导,智能指针,Lambda表达式等, 也不禁心里一惊,“好酷炫”,C++原来还可以这样玩, 才意识到之前的C++认知有点落伍了, 而落伍的核心原因,竟
2024-01-04 14:43:47
1073
原创 C++重温笔记(八): C++异常
1. 写在前面c++在线编译工具,可快速进行实验: https://www.bejson.com/runcode/cpp920/这段时间打算重新把c++捡起来, 实习给我的一个体会就是算法工程师是去解决实际问题的,所以呢,不能被算法或者工程局限住,应时刻提高解决问题的能力,在这个过程中,我发现cpp很重要, 正好这段时间也在接触些c++开发相关的任务,所有想借这个机会把c++重新学习一遍。 在推荐领域, 目前我接触到的算法模型方面主要是基于Python, 而线上的服务全是c++(算法侧, 业务那边基本上
2024-01-04 14:42:29
1076
原创 Shell脚本学习笔记
工作中,需要用到写一些shell脚本去完成一些简单的重复性工作, 于是就想系统的学习下shell脚本的相关知识, 本篇文章是学习shell脚本整理的学习笔记,内容参考主要来自C语言中文网, 学习过程中, 加入了一些在学习过程中的实践经验和思考, 并抽取出一些常用的知识内容整理成这篇文章,方便以后回看回练, 如果想更系统的学习, 可以去前面这个网站进行学习。大纲如下Shell基础Shell编程Shell高级Shell的一些快捷操作。
2024-01-02 20:20:45
1408
原创 FastAPI框架学习笔记(快速入门FastAPI框架)
今天整理一篇后端框架的笔记, fastapi框架是比较主流的后端异步web框架,关键是python语言可以写,正好公司最近安排了一些后端服务的活, 所以就看了一个fastapi框架的入门课程(链接在底部),完成任务,这次想把学习的笔记整理下,方便以后回看回练。
2023-10-29 09:36:34
6566
原创 C++重温笔记(十): C++输入输出流
1. 写在前面c++在线编译工具,可快速进行实验: https://www.bejson.com/runcode/cpp920/这段时间打算重新把c++捡起来, 实习给我的一个体会就是算法工程师是去解决实际问题的,所以呢,不能被算法或者工程局限住,应时刻提高解决问题的能力,在这个过程中,我发现cpp很重要, 正好这段时间也在接触些c++开发相关的任务,所有想借这个机会把c++重新学习一遍。 在推荐领域, 目前我接触到的算法模型方面主要是基于Python, 而线上的服务全是c++(算法侧, 业务那边基本上
2023-06-19 11:16:30
2102
原创 大数据框架Hadoop篇之Hadoop入门
Hadoop是一个Apache基金会开发的分布式系统基础架构, 主要解决: 海量数据的存储和海量数据的分析计算问题
2022-12-18 10:18:55
2424
1
原创 Pyspark学习笔记小总
pyspark官方文档: https://spark.apache.org/docs/latest/api/python/index.htmlpyspark案例教程: https://sparkbyexamples.com/pyspark-tutorial/这篇文章记录下最近学习的有关Pyspark以及用spark sql去处理大规模数据的一些常用语法,之前总觉得pandas是做数据分析和数据挖掘的利器, 但是工作之后,面对海量数据(上亿规模),这才发现,普通的pandas几乎毫无用武之力,所以有必要再重
2022-11-20 10:24:33
3449
2
原创 Protocol Buffers学习小记
这篇文章是有关Protocol Buffers的学习笔记,工作中这个东西会用的非常多,这是因为它提供了一种跨平台,跨语言,可延展且非常灵活的(前后向兼容)的序列化和反序列化结构化数据的方式,并且轻量悠然,在团队协作中,是一个必不可少的数据传输工具,不同团队做数据交互的时候,一般都会问到"你这个数据的proto定义是什么?", 而这个proto定义,其实就是protocol buffer的相关知识 了,如果这个东西不会用,在工作中可能会影响与其他团队的沟通,所以借着国庆,抓紧补一下这块知识。
2022-10-05 14:00:55
888
原创 git使用笔记总结(基于场景的git教程)
这篇文章依然是想整理下git的基本使用,之前实习的时候,也整理过,但发现写的有些乱(废话太多),尤其是在场景上,并且在公司工作了两个多月之后, 又对git有了新的使用体验,所以想重新写篇文章,把之前的整合一下,git真的非常重要,以后进公司与同事合作开发的必备技能, 但如果直接看教程文档,没有实际场景的话, 有些东西并不是很好理解,所以这篇文章会整理常用的git操作命令,并结合一些实际场景来辅助理解,目前这些命令,基本能cover住大部分公司中git的使用场景,如果后面遇到新的,也会再基于这篇文章补充。
2022-09-25 11:16:38
2207
原创 Durable rules(持久规则引擎) 学习小记
这篇文章记录下学习durablerules的过程,持久规则引擎是一个多语言框架,用于创建能够对大量事实陈述进行推理的基于规则的系统,白话的讲就是事先制定好一些规则,这些规则描述要匹配的事件以及采取的操作。这样,当有事实过来的时候,就可以去匹配事件然后采取相应的行为了。很类似我们代码中写的的逻辑。那么为啥要用这东西呢?快,且适用于多语言,且如果判断太多,不像ifelse那么臃肿。写出来的判断语句更加的优雅。当然,由于我也是刚学,且可参考的文档不多,我就拿github项目{"name"......
2022-07-25 15:50:45
1417
2
原创 ElasticSearch快速入门小记
工作中用到了ElasticSearch,这是一个全文搜索引擎,可以快速的储存搜索和分析海量数据,这个东西非常重要,各大公司也都在用。这篇文章是快速入门ElasticSearch的笔记记录,我的想法是先通过一些资料学习下这东西怎么使用,先用起来,后面如果需要补理论的话再去补就快了。下面分别从安装,基本概念,以及postman和通过PythonAPI使用ElasticSearch进行介绍。.........
2022-07-20 13:14:27
1710
原创 poetry管理python开发环境学习小记
在Python开发中,往往需要根据不同的需求搭建不同的Python环境,环境管理方面,之前学习到的方式是anaconda进行统一的管理,但是工作之后了解到,conda在本地开发时候会提供非常多的便利,但对于生产环境,conda会过于臃肿,且locking的能力需要额外安装工具,所以往往不适用生产环境中的Python环境管理。生产环境中,可以使用pyenv来管理各种Python版本,而poetry来管理虚拟环境。这篇文章,主要是记录下这两个工具的使用。......
2022-07-18 21:54:42
4477
原创 C++重温笔记(十一): C++文件操作
1. 写在前面c++在线编译工具,可快速进行实验: https://www.bejson.com/runcode/cpp920/这段时间打算重新把c++捡起来, 实习给我的一个体会就是算法工程师是去解决实际问题的,所以呢,不能被算法或者工程局限住,应时刻提高解决问题的能力,在这个过程中,我发现cpp很重要, 正好这段时间也在接触些c++开发相关的任务,所有想借这个机会把c++重新学习一遍。 在推荐领域, 目前我接触到的算法模型方面主要是基于Python, 而线上的服务全是c++(算法侧, 业务那边基本上
2022-07-05 10:49:31
2417
2
原创 西瓜书重温(七): 贝叶斯分类器(手推+代码demo)
1. 写在前面今天开始学习西瓜书第七章,有关贝叶斯分类器的基本知识, 贝叶斯决策论是在概率框架下实施决策的基本方法,对分类任务,在所有相关概率已知时, 贝叶斯决策论考虑如何基于概率和误判损失选择最优类别标记。当然,这个学习过程和我们之前学习的像SVM,神经网络等思路不太一样,这其实涉及到统计学界参数估计的两个经典学派: 频率学派和贝叶斯学派了,当然,也产生了两种相差比较远的估计方法(极大似然估计与贝叶斯估计), 另外还有两个我们常听到的名字生成模型与判别模型等。 这些东西都是啥? 背后又有哪些有意思的故
2022-06-24 19:15:20
2056
4
原创 C++重温笔记(七): C++模板与泛型程序设计
1. 写在前面c++在线编译工具,可快速进行实验: https://www.bejson.com/runcode/cpp920/这段时间打算重新把c++捡起来, 实习给我的一个体会就是算法工程师是去解决实际问题的,所以呢,不能被算法或者工程局限住,应时刻提高解决问题的能力,在这个过程中,我发现cpp很重要, 正好这段时间也在接触些c++开发相关的任务,所有想借这个机会把c++重新学习一遍。 在推荐领域, 目前我接触到的算法模型方面主要是基于Python, 而线上的服务全是c++(算法侧, 业务那边基本上
2022-06-21 23:00:23
1991
1
原创 word自带公式批量转成MythType格式的采坑小记
1. 写在前面这两天写毕设论文修改格式,原先使用的是word自带的公式,结果发现有两个问题:无法改变字体,默认是Cambria Math的字体, 但是没法改,但我这边发现都是用的新罗马字体论文正文行距是22磅的时候,发现公式显示不全基于以上两个痛点问题,导致我不得不重新修改公式的格式,换成MythType,但我论文里面有超级多的数学公式,寻思着这要是一个个的手敲, 那不得一整天时间, 结果就像看看有没有一键到位的操作。 结果还真有, mathtype有格式转换功能,能一键到位。 But, 我花
2022-05-06 00:02:12
7450
3
原创 Ubuntu更新显卡驱动与升级cuda版本“采坑“小记
1. 写在前面这次记录下今天安装百度的自动驾驶框架Apollo的时候,在硬件环境上采的一些坑,花费了5个多小时的时间,才把Apollo框架装上且能正常使用GPU,通过今天的摸索,让我对Cuda升级和显卡驱动等有了一定的了解。关于Apollo框架的安装过程,可以直接见官网我直接按照这个步骤来的,一开始是直接按照官网上说的步骤来的,不过之前由于实验室服务器上都装好了cuda等,所以这步跳了过去。从docker这里开始。 把前面的基础工作弄完之后,然后开始安装Apollo,这个也没费多大劲,装完。然后ap
2022-04-29 20:18:35
20882
3
原创 AI上推荐 之 多任务loss优化(自适应权重篇)
1. 写在前面在多任务学习中,往往会将多个相关的任务放在一起来学习。例如在推荐系统中,排序模型同时预估候选的点击率和浏览时间。相对于单任务学习,多任务学习有以下优势:多个任务共享一个模型,占用内存量减少;多个任务一次前向计算得出结果,推理速度增加;关联任务通过共享信息,相互补充,可以提升彼此的表现。前面的一篇文章,主要是从模型结构的角度聊了下多任务学习,介绍了工业界非常经典也常用的MMOE模型,然而,对于多任务学习, Loss的优化也非常重要, 因为我们知道通过多个目标去指导网络进行统一的训练
2022-04-28 21:00:41
14549
17
原创 AI上推荐 之 MMOE(多任务yyds)
1. 写在前面这篇文章开始多任务模型的学习,随着推荐技术的蓬勃发展,目前越来越多的推荐场景,往往并不是单纯的优化一个指标,比如:视频推荐领域: 推荐排序任务不仅需要考虑到用户点击率,完播率,也需要考虑到一些满意度指标,例如,对视频是否喜欢,用户观看后对视频的评分;文章推荐领域: 不仅希望用户点击阅读文章,还希望用户有更多的停留时长,互动、关注。电商推荐领域: 不仅希望用户更多对商品点击浏览,还希望用户看完商品后进行付费,点击率和转化率所以,推荐系统做到后期,往往会朝着多目标学习进行演化,承担更
2022-04-20 21:14:47
4995
14
原创 Dropout技术之随机神经元与随机深度
1. 写在前面在学习复现EfficientNet网络的时候,里面有一个MBConv模块长下面这个样子:当然,这个结构本身并不是很新奇,从resNet开始,几乎后面很多网络,比如DenseNet, MobileNet系列,ShuffleNet系列以及EfficientNet系列都会发现这样的残差结构。 但这次探索里面发现了Dropout这个点, 之前在实现残差结构的时候, 如果碰到Dropout, 我一直以为是之前学习到的随机失活神经元的Dropout,但直到在这里看到源码才发现,不是我想象的那么简单!
2022-04-16 11:02:48
1957
墨尔本气温预测.zip
2020-03-12
深度学习理论知识.zip
2020-01-05
机器学习理论知识.zip
2020-01-05
AI算法工程师手册.zip
2020-01-05
机器学习、深度学习面试笔试题300+.pdf
2019-11-24
数据处理之特征选择知识.pdf
2019-11-08
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人