- 博客(947)
- 收藏
- 关注
原创 李宏毅2025秋季机器学习作业 GenAI-ML-HW2-Build a Basic RAG System实操1
本文介绍了三种获取和运行机器学习实验脚本的方法:1)通过Google Colab复制和运行源脚本;2)通过Kaggle复制代码到自己的笔记本;3)将脚本下载到本地,使用VSCode和Jupyter Lab进行调试。详细说明了本地环境配置步骤,包括Anaconda环境设置、Jupyter Lab启动、修改默认目录以及解决HuggingFace目录问题。最后提到在NVIDIA 3090显卡上运行时遇到问题。
2025-10-21 09:12:01
447
原创 让AI代理搜索任何应用的Airweave
摘要: Airweave是一款帮助用户快速搜索和访问各类应用、数据库及文档的工具,通过标准化接口整合多源数据。支持托管和自托管(Docker部署),提供REST API、语义搜索及25+数据源同步(如PostgreSQL、Slack等)。内置Python/JS SDK,具备增量更新、版本管理等功能,技术栈涵盖FastAPI、PostgreSQL和Qdrant。类似项目包括Haystack、Elasticsearch等,适合需要高效数据检索的场景。 (字数:149)
2025-10-21 09:07:43
418
原创 宠粉啦!七月在线季卡福利,快来吧。价值499现在只需要199,名额有限,只有9个,需要请发消息联系。
《七月在线机器学习集训营》提供系统化机器学习培训,涵盖算法原理、实战项目及面试技巧。课程包含Python基础、监督/无监督学习、深度学习等核心内容,配备企业级项目实战和1v1就业指导。适合零基础学员及希望转行的从业者,通过3-4个月学习快速掌握ML/DL技能。官网显示课程原价6800元,现优惠价4800元。教学采用直播+录播模式,班主任全程督学,完成课程可获认证证书。
2025-10-20 17:23:39
59
原创 李宏毅2025秋季机器学习作业 GenAI-ML-HW1-Understand the fundamentals of GenAI实操2
这篇文章介绍了GenAI和ML的第一个作业内容,主要目标包括熟悉Google Colab环境、理解token和tokenizer等核心概念、观察不同提示设置下的模型表现,以及学习使用Gradio构建简单用户界面。文章详细说明了如何在Colab中激活GPU(包括T4、A100和V100选项),并提供了检查GPU状态的命令示例。通过nvidia-smi命令的输出,展示了当前GPU(NVIDIA GeForce RTX 3090 Ti)的详细使用情况,包括温度、功耗、内存占用和正在运行的进程信息。
2025-10-20 10:59:50
1172
1
原创 让你轻松掌握 Prompt Engineering 的秘籍!
《Prompt Engineering指南》是一份全面介绍如何优化提示以提升语言模型性能的资源。该指南面向研究者和开发者,详细讲解了提示工程的基础概念、核心技术(如零样本提示、思维链提示等)及其在问答、推理、代码生成等场景的应用。网站提供丰富的学习资源,包括研究论文、视频讲座、代码示例和实用提示库,并支持本地部署。指南还推荐了相关领域的优秀项目,帮助用户深入理解提示工程技术,有效提升与大型语言模型的交互能力。
2025-10-20 10:58:25
498
原创 利用九天人工智能平台完成ML2023Spring_HW4实操
在九天AI平台搭建机器学习环境 本文介绍了在九天人工智能平台上搭建机器学习环境的完整流程。首先启动云主机实例,创建名为ml2021-hw1-1的conda环境并导出配置文件。然后安装必要的Python包,包括PyTorch、TensorBoard等深度学习框架。接着将conda环境注册为Jupyter Notebook内核。最后从台湾大学李宏毅教授课程官网下载课后习题代码,并介绍了Speaker Classification任务的具体要求,包含从简单运行样例代码到实现Conformer、Self-Atten
2025-10-19 10:49:35
1029
原创 加速你的 AI 编程助手:Archon OS 首次公开测试版发布!
Archon是一个AI编码助手指挥中心,作为模型上下文协议服务器来管理项目知识、任务和上下文。它提供文档管理、智能搜索、任务协作等功能,支持多种AI编码助手集成。 主要特性包括: 网页抓取和文档处理(PDF/Word/Markdown) 先进的RAG搜索策略 层次化项目管理 实时协作更新 多AI代理支持 安装需Docker/Supabase/OpenAI密钥,提供Web界面和API服务。与Haystack、Langchain等工具相比,Archon更专注于编码场景的文档与任务集成,提升AI辅助开发效率。
2025-10-19 10:30:06
346
原创 利用九天人工智能平台完成ML2023Spring_HW3实操
本文介绍了在九天人工智能平台上配置机器学习开发环境的完整流程。首先展示了如何启动云主机实例并激活conda环境,详细导出了包含Python 3.9、CUDA 11.1及相关机器学习库(如TensorFlow 2.20、PyTorch 1.8.0等)的环境配置文件。接着指导用户将conda环境注册为Jupyter Notebook内核,并下载台湾大学李宏毅教授2021年春季机器学习课程的课后习题代码。最后介绍了如何手动上传数据集,并建议在Kaggle平台上运行课程作业中的图像分类项目。文中还提供了相关资源的获
2025-10-18 14:26:53
742
原创 轻松配置与监控Claude Code,提升开发效率!
摘要: Claude Code Templates是一款专为Anthropic Claude AI设计的CLI工具,提供100+预配置AI代理、命令、集成和模板,显著提升开发效率。支持快速安装组件(如安全审计代理、性能优化命令)、实时会话监控、健康检查及插件管理,简化AI开发流程。通过交互式平台aitmpl.com和完整文档,开发者可轻松实现代码审计、GitHub集成等场景。同类工具包括Yeoman、Create React App等,但Claude Code Templates以AI为核心,专注于自动化与
2025-10-18 14:26:08
699
原创 Bun:超快速的JavaScript工具集,让开发更高效!
Bun是一款新兴的全能JavaScript工具包,集运行时、打包器、测试运行器和包管理器于一体。它以Zig语言编写,基于JavaScriptCore,提供比Node.js更快的启动速度和更低的内存占用。Bun支持直接运行TypeScript/JSX代码,内置简单高效的测试运行器,简化了包管理流程。安装方式多样(脚本/Docker/npm等),兼容主流操作系统。适用于Web开发、API构建、自动化脚本等场景,能与现有Node项目无缝集成。相比Node.js、Deno等工具,Bun在性能、易用性和工具整合方面具
2025-10-17 11:36:49
663
原创 利用九天人工智能平台完成ML2023Spring_HW2实操
本文介绍了在九天人工智能平台上创建机器学习实操环境的完整流程。首先展示了启动学习实例云主机环境的界面截图,然后详细记录了通过conda导出环境配置(ml2021-hw1-1)到environment.yml文件的过程,包含完整的依赖包列表。接着说明如何获取台湾大学李宏毅教授机器学习课程资源,包括通过B站观看视频、官网获取课件PDF以及从GitHub克隆课后习题代码库。最后重点介绍了Homework 2语音分类任务的数据准备,包括从Google Drive下载数据集(包含训练/测试元数据、标签和特征文件)并解
2025-10-17 08:13:46
914
原创 高效的 LLM 推理,尽在 llama.cpp!
llama.cpp是一个C/C++实现的大规模语言模型推理工具,专注于高性能和易用性。该项目支持多种硬件架构,包括Apple Silicon、x86和GPU(NVIDIA/AMD),提供1.5-8bit整数量化以提升效率。主要功能包括命令行工具llama-cli(支持对话模式和文本补全)和HTTP服务器llama-server(支持并发请求)。安装方式多样,支持Docker和预编译二进制文件。该项目适用于本地开发、云服务和学术研究场景,相比同类工具具有更高性能和更简洁的架构。
2025-10-16 09:06:35
332
原创 利用九天人工智能平台完成ML2023Spring_HW1实操
本文介绍了在九天人工智能平台上创建机器学习实操环境的完整流程。首先展示了如何启动云主机实例并激活conda环境(ml2021-hw1-1),然后通过conda命令导出环境配置文件environment.yml。接着详细说明了如何将环境注册到Jupyter Notebook内核,并介绍了获取李宏毅教授机器学习课程资料的方法,包括视频、课件和课后习题代码。最后展示了如何手工上传数据集并在Jupyter中正确选择运行环境。文章还包含了Homework 1的作业要求,这是一个基于DNN的COVID-19病例预测回归
2025-10-16 09:04:03
1738
原创 探索libsignal:为Signal提供强大加密保障的开源库
摘要:libsignal是Signal应用的加密协议库,提供跨平台API支持端对端加密通讯。该库采用Rust编写,包含Double Ratchet算法、零知识证明等核心组件,支持Android、iOS等多平台开发。文章详细介绍了libsignal的架构、功能模块、安装配置方法以及在Android/Swift/Node.js平台的具体应用,并对比了Matrix等同类方案,突出其在安全性和易用性方面的优势,为开发者构建安全通讯应用提供技术参考。
2025-10-15 09:06:31
764
原创 计算机像人类一样工作——探索Agent S开源框架!
Agent S是一个开放智能框架,旨在让计算机像人类一样理解并执行复杂任务。该项目通过自主学习提升GUI交互体验,在OSWorld测试中准确率接近人类水平(69.9%)。支持Linux/macOS/Windows平台,提供CLI和Python两种调用方式,整合了OpenAI、Anthropic等多个AI模型。安装简单,但需注意直接执行代码的安全风险。同类项目对比显示,Agent S在任务自动化和泛化能力方面表现突出。该框架有望革新人机交互方式,提高工作效率。
2025-10-15 09:05:05
562
原创 提升大型语言模型性能的利器——Tunix
摘要:Tunix是基于JAX的大型语言模型后训练库,支持监督微调、强化学习和知识蒸馏。它采用模块化设计,提供高效分布式训练,支持LoRA/Q-LoRA等参数高效微调方法,以及DPO、GRPO等强化学习算法。目前处于早期开发阶段,未来将扩展更多功能如多主机训练和高级RL算法。用户可通过PyPI或GitHub安装,并提供了多个示例教程。相比Hugging Face Transformers等同类项目,Tunix专注于高效后训练机制,为LLM研究和应用提供优化支持。
2025-10-14 09:06:37
765
原创 利用 Meshery 提升云原生管理效率
摘要: Meshery是一款开源的云原生管理平台,支持Kubernetes多集群和多云环境的管理。作为CNCF项目,它提供可视化GitOps协作、基础设施生命周期管理(支持300+云原生集成)、模拟部署(dry-run)验证、上下文感知策略及性能分析等功能。通过工作区和环境管理,Meshery优化团队协作与资源控制,并支持负载测试(Fortio/Wrk2等)。用户可通过mesheryctl快速安装,或加入社区参与开发。相比Rancher、OpenShift等工具,Meshery更注重统一管理与可扩展性。
2025-10-13 09:23:03
1173
原创 轻松转化数据,提高工作效率,探索 dbt!
dbt:高效数据转换工具 dbt(数据构建工具)让分析师通过简单的select查询即可转换数据,自动生成数据仓库中的表和视图。核心功能包括模型构建、关系可视化和数据测试,确保数据质量。用户可通过安装dbt Core、探索dbt Cloud快速上手,并加入活跃的Slack社区。相比Airflow、Luigi等工具,dbt将软件工程实践引入数据分析,显著提升数据处理效率。该工具特别适合需要构建可靠数据分析模型的企业和团队。
2025-10-13 09:19:16
474
原创 轻松可视化数据的利器——JSON Crack
JSON Crack是一款开源数据可视化工具,支持JSON、YAML、XML等格式转换和交互式图形展示。核心功能包括数据格式转换、美化验证、代码生成、JSON Schema支持等,所有数据处理均在本地完成确保隐私安全。适用于开发者调试API、数据分析师展示结果等场景。提供Docker部署方式,支持通过Node.js环境开发运行。该工具简化了数据结构理解,是数据建模和开发的实用助手。
2025-10-12 08:40:31
987
原创 管理您的秘密,保护团队安全的开源平台 - Infisical
Infisical是一款开源的密钥管理平台,旨在为开发团队提供安全、便捷的敏感信息管理解决方案。其核心功能包括密钥管理(支持版本控制、轮换、动态密钥等)、内部PKI管理、KMS加密解密系统以及SSH证书管理。平台支持多种集成方式(GitHub、Vercel、AWS等),提供RBAC访问控制、审计日志和自托管选项。用户可通过Infisical Cloud快速使用,或通过Docker在本地部署。相比Vault、AWS Secrets Manager等同类产品,Infisical以开源特性、易用性和强大的集成功能
2025-10-12 08:39:57
816
原创 提升数据处理效率的利器:Pathway Python ETL框架
Pathway是一个强大的Python ETL框架,专为实时数据处理、流分析和AI管道设计。它结合易用的Python API和高效的Rust引擎,支持批量和流数据处理,可部署在Docker/Kubernetes上。Pathway在性能上超越Flink、Spark等框架,适用于实时ETL、LLM管道、RAG等场景,提供简单API和监控仪表盘,支持本地和云端部署。相比Apache NiFi、Airflow等工具,Pathway在实时处理能力、易用性和统一批流处理方面具有优势。
2025-10-11 08:06:48
705
原创 李宏毅2025春季机器学习作业ML2025_Spring_HW4在kaggle上的实操笔记
这篇文章介绍了使用Transformer解码器架构进行预训练的作业任务,重点是应用到宝可梦图像上的下一个token预测。文章提供了相关的教学幻灯片链接和课程助教联系方式,并展示了安装必要Python包(如datasets库)的过程,包括依赖项的安装情况。代码演示了如何通过pip安装指定版本的datasets包(3.3.2版),并自动处理所有依赖项。
2025-10-11 08:06:16
891
原创 李宏毅2025春季机器学习作业ML2025_Spring_HW3_understanding_LLM_transformers实操笔记
摘要 本文档展示了如何设置环境以使用Transformers模型库。首先检查了GPU状态(NVIDIA Tesla T4),然后安装特定版本的Transformers库(4.47.0)及其依赖项。安装过程显示所有必需包(如filelock、huggingface-hub、numpy等)已满足要求,最终成功安装了tokenizers和transformers组件。该环境配置为后续使用Transformers模型提供了稳定基础。
2025-10-10 06:41:34
1139
原创 高性能自托管照片与视频管理解决方案,让管理更轻松!
Immich是一款高性能自托管照片和视频管理解决方案,支持自动备份、多用户共享和智能搜索功能。用户可通过移动端或网页上传、查看媒体文件,系统能防止重复存储并支持选择性备份。该工具适合家庭、摄影师及企业使用,提供原始格式支持与灵活相册管理。安装简便,建议配合3-2-1备份策略保障数据安全。同类项目Piwigo和PhotoPrism各有特色,用户可按需选择。Immich以隐私保护和高效管理为核心,是替代云服务的理想选择。
2025-10-10 06:40:51
789
原创 李宏毅2025春季机器学习作业ML2025_Spring_HW1实操第一集
本文介绍了ML2025课程第一次作业中关于检索增强生成(RAG)与智能代理的环境配置过程。主要包括:1)安装必要的Python包(llama-cpp-python等)和下载量化版LLaMA 3.1 8B模型(约8GB);2)验证PyTorch版本(2.5.1)和CUDA可用性(NVIDIA RTX 3090 Ti显卡);3)通过nvidia-smi命令检查GPU状态。完整配置为后续实现RAG系统提供了基础运行环境。
2025-10-09 09:03:10
984
原创 李宏毅2025春季机器学习作业ML2025_Spring_HW1实操第二集
本文介绍了如何使用量化版LLaMA 3.1 8B模型进行检索增强生成(RAG)的实验环境搭建。主要内容包括:1) 安装必要的Python包并下载模型权重(约8GB);2) 加载LLM模型到GPU;3) 提供generate_response函数用于生成模型响应;4) 实现基于Google搜索的检索工具,可获取与问题相关的网页内容。实验环境要求GPU支持,并提供了token计数工具以控制输入长度。整体流程展示了如何结合大型语言模型和外部检索工具构建问答系统的基础框架。
2025-10-09 09:02:44
1301
原创 提升下载效率的AB Download Manager,你还在等什么?
AB Download Manager是一款免费开源的跨平台下载管理工具,支持Windows、Linux和Mac系统。它提供多线程加速下载、任务调度、浏览器扩展集成等功能,并拥有现代化的用户界面和主题选择。用户可通过winget、scoop或安装脚本快速部署,还能加入社区参与反馈。该项目仍处于开发阶段,欢迎用户报告问题或提出建议。与其他主流下载工具相比,AB Download Manager在保持轻量化的同时提供了全面的下载管理解决方案。
2025-10-08 08:20:48
751
原创 李宏毅2025秋季机器学习第三讲了解语言模型內部是怎么运作的演示实操2
這份程式是為了輔助說明李宏毅教授《生成式人工智慧及機器學習導論》第三講的觀念,目的是透過執行此程式,讓學生更清楚理解大型語言模型內部的類神經網路如何運作。在開始執行之前,請先點選上方工具列的「檔案」,選擇「在雲端硬碟中儲存副本」,再於自己的副本中進行操作。以下程式碼將登入 Hugging Face Hub,以便接下來取得模型。但在此之前,我們需先取得 Hugging Face 的「Token」(此處的 Token 指的是認證憑證,與生成式 AI 中的 token 無關)。
2025-10-08 00:28:06
1407
原创 李宏毅2025秋季机器学习第三讲了解语言模型內部是怎么运作的演示实操1
将http://127.0.0.1:8888/lab?token=f0145747f81a7d82a18bff2c40881db8d603a7ef722a5a90填入。Ctrl+F搜索找到c.ServerApp.notebook_dir = ''这一行。使用Windows的命令提示符(CMD)需要重新打开命令提示符窗口才能生效。
2025-10-08 00:27:25
241
原创 李宏毅2025秋季机器学习第一讲大型語言模型的基本原理演示实操2
本文摘要:李宏毅教授《生成式AI及机器学习导论》课程第一讲的示范程序,旨在通过HuggingFace Transformers套件帮助学生理解大型语言模型的基本概念。程序安装并配置了相关工具包(transformers/torch等),说明需在GPU环境下运行,并详细介绍了HuggingFace Token的获取方式。该教学演示强调概念清晰而非执行效率,使用HuggingFace平台因其高灵活性和广泛应用性,适合初学者快速上手语言模型原理。
2025-10-07 11:12:50
1079
原创 李宏毅2025秋季机器学习第二讲AI 使用工具概念介紹演示实操
以此份程式作為示範,旨在說明李宏毅教授《生成式人工智慧及機器學習導論》課程第二講中的 Tool Use 觀念。透過執行本程式,學生可以更清楚地理解 AI 使用工具的概念。此程式碼的設計重點在於清楚傳達觀念,而非追求執行效率。由於本程式的主要目的是傳遞觀念,對於程式語法將不進行深入說明。讓我們開始吧我們使用 gemma-3-4b-it 這個模型,我們以下都用 pipeline 這個方法來使用這個模型大型語言模型如何使用工具這裡我們會展示大型語言模型如何使用工具來讓語言模型使用工具吧!在上面這段程式碼
2025-10-07 11:11:44
293
原创 轻松下载各类在线媒体 - Media Downloader 来啦!
摘要: Media Downloader 是一款基于 Qt/C++ 开发的跨平台媒体下载工具,集成 yt-dlp、gallery-dl 等命令行工具,支持视频、音乐及播放列表下载。其特点包括多格式选择、批量/并发下载、多语言界面(15种语言)及扩展管理功能。支持 Windows(Qt5/Qt6)、MacOS(需解决未验证提示)和 Linux(Fedora/Arch等),提供安装包与便携版,用户还可自行编译。界面友好,但需注意遵守当地法律法规。同类工具包括 JDownloader 和 youtube-dl 等
2025-10-06 09:24:12
824
原创 用pix2tex轻松将数学公式图像转化为LaTeX代码!
pix2tex是一个基于视觉转换模型(ViT)的工具,可将数学公式图片转换为LaTeX代码。它支持文档和手写公式识别,适用于学术写作、教育等领域。该工具提供命令行、GUI界面和API三种使用方式,并支持自定义模型训练。安装简单,只需pip安装即可使用。项目采用ViT编码器与ResNet主干结合Transformer解码器,性能表现优异。相比同类商业工具,pix2tex提供开源免费的解决方案,能显著提升数学公式处理效率。
2025-10-06 09:21:56
1134
原创 提升工作效率的利器:Microsoft PowerToys 在 Windows 上的神奇应用
Microsoft PowerToys是微软推出的开源工具套件,旨在提升Windows用户的生产力和操作体验。它包含FancyZones窗口管理、Awake防休眠、Color Picker取色器、Image Resizer图片调整等11项实用功能,支持快捷键自定义、批量文件重命名等高级操作。最新版本增加了Command Palette快捷启动器等功能,可通过GitHub、Microsoft Store或WinGet安装。作为Windows专属生产力工具,PowerToys凭借系统深度集成和持续更新,成为优化
2025-10-05 12:18:28
850
原创 快速构建网站的利器——Symfony PHP框架
摘要:Symfony是一个功能强大的PHP框架,采用组件化设计,提供长期支持版本和完善的文档支持。开发者可通过Composer快速安装,并利用丰富的学习资源快速上手。Symfony拥有活跃的社区和完善的安全漏洞报告机制。与Laravel、CodeIgniter、Yii等框架相比,Symfony以灵活性、强大组件和社区支持著称,适合构建各类Web应用。
2025-10-05 12:16:57
640
原创 TradingAgents 中文增强版:更高效的金融交易决策利器!
TradingAgents中文增强版是一个基于多智能体大语言模型的金融交易决策框架,专为中文用户优化,支持A股、港股和美股分析。最新版本cn-0.1.15新增了千帆大模型支持和完善的开发工具链,提供原生OpenAI接口、多厂商模型选择、Docker容器化部署等功能。项目适用于个人投资者、金融机构和学术研究,可通过Web界面快速进行股票分析并导出专业报告。安装方式提供Docker和本地两种方案,支持多格式股票代码输入和5级研究深度选择。相比同类产品,该项目在中文支持和本地化体验方面具有优势。
2025-10-04 18:25:27
758
原创 使用Kestra轻松实现事件驱动的工作流编排!
Kestra是一款开源的事件驱动编排平台,通过声明式YAML配置简化工作流管理。它支持代码与UI结合构建,提供定时调度和实时事件触发能力,内置丰富的插件生态系统(支持Python、Node.js等多种语言)。Kestra具有高可扩展性,可处理百万级工作流,并集成Git版本控制实现CI/CD。平台提供直观的UI编辑器,支持拖拽式构建和实时验证。用户可通过Docker快速部署,其核心概念包括工作流、任务和命名空间等。相比Airflow、NiFi等工具,Kestra以简洁的配置和强大的扩展性见长。
2025-10-04 18:23:31
1035
原创 Django - 让开发变得简单高效的Web框架
Django是一个高效的Python Web框架,专注于快速开发和简洁设计。它提供开箱即用的功能如用户认证、数据库管理、URL路由和模板引擎,支持快速构建各类Web应用。Django强调安全性,内置防护措施应对SQL注入、CSRF等威胁,同时具备优秀可扩展性。安装简单,通过pip即可完成,且拥有详细的文档教程和活跃社区支持。相比同类框架如Flask、FastAPI,Django更适合需要快速构建功能完整的中大型项目。
2025-10-03 10:21:05
584
原创 探索高效安全的去中心化应用——Solana区块链
摘要:Solana是一个高性能区块链平台,旨在为去中心化应用提供快速、安全、可扩展的基础设施。其核心优势包括每秒处理数万笔交易的高吞吐量、强大的安全机制和去中心化架构。文章详细介绍了环境搭建步骤,包括Rust工具链安装、代码获取、项目构建和测试方法,同时提供了性能测试和代码覆盖率评估指南。Solana的开发工具支持帮助开发者快速构建商业级应用,与其他主流区块链项目如Ethereum、Polygon和Cosmos共同推动去中心化技术发展。
2025-10-03 10:20:42
714
原创 轻松学会像老乡鸡一样做饭!
“像老乡鸡厨艺指南”是一个开源项目,旨在帮助用户芒种家庭复刻老乡鸡的美味菜品。该项目基于《老乡鸡菜品溯源报告》整理,提供菜品索引、在线浏览教程、AI配图指导等功能,并支持Docker部署。用户可通过网页端查看详细制作步骤,或参与社区分享实拍作品。此外,项目还推荐了How To Cook等同类同类烹饪资源,助力用户提升厨艺。该项目预计2024年完成,目前为非官方作品,欢迎烹饪爱好者共同建设。
2025-10-02 08:36:46
280
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人