- 博客(305)
- 收藏
- 关注
原创 一个超强的推理增强大模型,开源了,本地部署
Mistral公司发布首款推理大模型Magistral及其自研强化学习流程。Magistral包含24B参数的开源版Small和企业版Medium,采用纯RL训练方法增强多步推理能力,在GPQA等专业测试中表现优异。该模型支持128k上下文,量化后可本地部署。官方提供了llama.cpp等量化版本,并建议特定参数设置以获得最佳性能。Magistral的设计理念强调透明推理流程和多语言适应性,但中文支持相对较弱。
2025-06-11 14:23:48
382
原创 阿里牛逼,又开源两个遥遥领先的模型(向量化、重排),知识库要翻天地覆了
阿里开源家族新增Qwen3-Embedding和Qwen3-Reranker两款模型,专为文本表征、检索和排序任务设计。Qwen3-Embedding提供0.6B、4B和8B三种参数版本,其中8B版在MTEB多语言排行榜位列第一,0.6B版模型文件仅1.2GB。Qwen3-Reranker同样提供三款参数版本,在多项检索任务中表现优异。两款模型均支持指令感知和119种语言,适用于知识库、RAG等场景。Qwen3-Reranker-0.6B已超越同类产品BGE-reranker-v2-m3。目前模型可通过Mo
2025-06-06 16:07:37
961
原创 DeepSeek-R1蒸馏Qwen3-8B模型,双 4090本地部署,深得我心
《DeepSeek-R1-0528-Qwen3-8B模型实测:2张4090部署,性能接近32B大模型》 文章介绍了DeepSeek最新开源的数学推理专用模型DeepSeek-R1-0528-Qwen3-8B,该模型通过思维链蒸馏技术训练,在AIME数学竞赛测试中86.0分,性能超越原版Qwen3-8B 10%,接近Qwen3-32B水平。作者使用2张4090显卡通过vLLM成功部署该16GB模型,推理速度达90 tokens/s(Qwen3-32B为40 tokens/s)。实测显示,该模型在自我介绍、代码
2025-06-05 14:42:19
1021
原创 用大模型,把论文吃干榨净!
大家好,我是 Ai 学习的老章大模型火热,各种论文满天飞我主要在 arxiv 看最新的 AI、大模型方面本号数次推荐过一些好用的读论文工具,有点散本文就做个总结——借助大模型,把论文精髓吃干榨净。
2025-06-04 12:16:00
613
原创 小米又开源了,一个多模态大模型,一个生不逢时的推理大模型
大家好,我是 Ai 学习的老章上月底,,它从零开始训练并专为推理任务设计的模型系列。通过优化的预训练和后训练策略,MiMo-7B 展现出了超越许多更大模型的推理潜力。昨天,小米又开源了 MiMo-VL-7B 系列多模态大模型、MiMo-7B-RL-0530 系列推理模型咱们挨个看一下情况。
2025-06-04 12:14:00
898
原创 小米又开源了,一个多模态大模型 + 一个生不逢时的推理大模型
小米开源多模态大模型MiMo-VL-7B与推理模型MiMo-7B-RL-0530。MiMo-VL-7B支持文字、图像、视频输入,包含SFT和RL两个版本,在多项基准测试中表现优异,号称超越同参数开源模型。同时发布的MiMo-7B-RL-0530专注于数学和代码推理,支持SGLang和vLLM部署。文章对比了这些模型与阿里Qwen2.5-VL-7B和DeepSeek-R1-0528的性能,但指出缺乏详细部署文档和试用体验。文末附有技术报告PPT及相关资源链接。
2025-06-04 11:57:00
735
原创 用大模型,把论文吃干榨净!
这篇文章总结了7款借助大模型高效阅读和处理AI论文的工具:1. Soarxiv可视化查找同类论文;2. MCP批量下载总结论文;3. 豆包插件实现网页端翻译总结;4. 沉浸式翻译提供双语对照阅读;5. AlphaXiv将论文转化为博客;6. Paper2Code自动生成论文代码;7. 论文转PPT工具生成专业演示文稿。这些工具涵盖了从论文检索、阅读理解到代码实现和展示的全流程,极大提升了研究效率。作者提供了详细的使用教程和工具链接,适合AI研究人员和开发者参考使用。
2025-05-30 14:21:17
873
原创 DeepSeek R1 最新版本模型,排名第三,蒸馏的Qwen3深得我心
DeepSeek-R1-0528模型迎来升级,性能显著提升,在复杂推理任务上接近顶级模型水平。新版本在AIME测试中准确率提升至87.5%,同时优化了幻觉率、代码生成等功能。此外,DeepSeek还开源了小型模型DeepSeek-R1-0528-Qwen3-8B,通过蒸馏技术获得优秀表现。虽然部署成本较高,但该模型在AIME测试中超越原Qwen3-8B性能,值得期待。文章作者计划测试该模型性能,并分享了相关技术资料。
2025-05-30 10:33:37
50
原创 实测,大模型谁更懂数据可视化?
大家好,我是 Ai 学习的老章看论文时,经常看到漂亮的图表,很多不知道是用什么工具绘制的,或者很想复刻类似图表。前文,我用 Kimi、Qwen-3-235B-A22B、Claude-3.7-sonnet、GPT-4.1、Gemini 2.5 Pro 测试了其在 LaTeX 公式识别中的表现。本文就测试一下他们在图表识别、复刻中的表现,看看谁更擅长干这件事备注:Kimi 开启了长思考,Qwen3 未开启深度思考,因为开启之后巨慢且失败。
2025-05-29 12:53:47
1025
原创 大模型妙用,把难懂的论文变成PPT
下面咱们逐步展开:第一步 准备论文素材比如我有把非常经典的《# Attention Is All You Need》这篇论文转成 PPT在 arxiv 网页右侧找到 TeX Source,下载然后找到支持知识库问答的 IDE,比如我的是 WindSurfCursor,还有其他 chatbot 应该也可以,比如之前我推荐的 cherry Studio(我没测试)
2025-05-29 12:30:15
960
原创 阿里又开源了,超长上下文大模型
大家好,我是Ai学习的老章阿里又开源新模型了,这次是通义千问文档团队带来的——首个通过强化学习训练、专为长上下文推理设计的大语言模型。解决的问题是:大型推理模型(LRMs)通过强化学习(RL)展现出强大的推理能力,但局限于短上下文推理任务,这个 QwenLong-L1 框架,通过渐进式上下文扩展将短上下文 LRMs 适配至长上下文场景。
2025-05-27 16:34:54
46
原创 大模型参加高考,同写2024年高考作文,及格分(通义千问、Kimi、智谱清言、Gemini Advanced、Claude-3-Sonnet、GPT-4o)
大家好,我是章北海今天高考,上午的语文结束,市面上又要来一场大模型参考的文章了。我也凑凑热闹,让通义千问、Kimi、智谱清言一起来写一下高考作文。公平起见,不加任何其他prompt,直接把题目甩过去。感觉写的都很一般,通篇口水文,都能拿个及格分吧。有点好奇,就加了几个国外选手参赛:Gemini Advanced、Claude-3-Sonnet、GPT-4o,个人认为写的还不错。大家感觉呢?看完投个票新课标I卷阅读下面的材料,根据要求写作。(60分)
2024-06-07 21:03:58
2227
3
原创 机器学习周刊第六期:哈佛大学机器学习课、Chatbot Ul 2.0 、LangChain v0.1.0、Mixtral 8x7B
大家好,欢迎收看第六期机器学习周刊本期介绍10个内容,涉及等,
2024-01-16 21:01:32
654
原创 机器学习周刊第五期:一个离谱的数据可视化Python库、可交互式动画学概率统计、机器学习最全文档、快速部署机器学习应用的开源项目、Redis 之父的最新文章
大家好,欢迎收看第五期机器学习周刊本期介绍7个内容,涉及等,
2024-01-16 21:00:18
436
原创 机器学习周刊 第4期:动手实战人工智能、计算机科学热门论文、免费的基于ChatGPT API的安卓端语音助手、每日数学、检索增强 (RAG) 生成技术综述
PIA:照片转动漫风格工具,可线上试用地址带web界面的声音克隆工具地址地址支持GeminiPro Vision / Cloudflare Workers AI / ChatGPT的融合Web平台。
2024-01-08 12:11:59
1631
原创 机器学习周刊03:如何学习深度学习?2024 年学习生成式 AI 路线图、如何构建高效的RAG系统、苹果 腾讯最新论文、阿里DreaMoving
机器学习周刊:关注Python、机器学习、深度学习、大模型等硬核技术。
2024-01-08 12:07:57
1387
原创 机器学习周刊第二期:300个机器学习应用案例集
大家好继续分享我最近看过并觉得非常硬核的资源,包括Python、机器学习、深度学习、大模型等等。
2024-01-07 09:34:52
1334
原创 玩转Python:数据可视化,一个很高级的交互式Python库,附代码
HvPlot 是基于 HoloViews 的高层抽象绘图库,但它提供了更为直接和方便的API,使得创建复杂的交互式图表变得简单快捷。HvPlot 可以与 Pandas、xarray 等数据处理库无缝集成,并且支持 Bokeh、Matplotlib 等多种绘图后端,允许用户根据需要制作静态或交互式图表。
2024-01-07 09:29:10
1281
原创 玩转Python:用Python处理文档,5个必备的库,特别实用,附代码
请注意,这些代码示例是为了展示每个库的基本用法,实际使用时可能需要根据具体需求进行调整。此外,确保在运行代码之前已经安装了相应的库,可以使用。在Python中,有几个流行的库用于处理文档,包括解析、生成和操作文档内容。- 用于处理Microsoft Word文档(.docx)。- 用于处理Excel文件(.xlsx)。- 用于解析HTML和XML文档。- 用于处理PDF文件。- 用于生成PDF文档。
2024-01-06 14:28:23
684
原创 ChatGPT 沦为了我的打工仔
最近在折腾之前搞的R-bookdown网站、Jekyll博客,还有刚上了Astro做的周刊、Astro Starlight做的文档站。但是前端我是一窍不通,只能在现成的主题上修修改改,即便如此还是遇到了很多问题。HF语音课:https://hf-audio.zhanglearning.com/周刊:https://weekly.zhanglearning.com/博客:https://blog.zhanglearning.com/真的无法想象,没有机必替帮忙,我要花费几倍的时间才能搞定这些事情。
2024-01-06 14:24:25
450
原创 玩转Python:用Python处理文本数据,附代码
通过使用这些库,Python 程序员能够执行各种文本处理任务,从简单的字符串操作到复杂的文本分析和处理。根据项目的具体需求,正确选择合适的库对于提高效率和代码质量至关重要。Python 提供了多种库来处理纯文本数据,这些库可以应对从基本文本操作到复杂文本分析的各种需求。
2024-01-05 10:29:13
705
原创 玩转Python:处理图像,两个非常重要的库,很实用,附代码
在Python中,图像处理是一个涉及图像分析、编辑和处理的广泛领域。有几个流行的库通常用于处理图像,每个库都有其特殊的功能和优势。
2024-01-04 17:30:42
493
原创 玩转Python:处理音频文件,两个非常重要的库,很实用,附代码
如果需要进行复杂的音频处理,或者与其他底层音频库(如Librosa或SciPy)结合使用,SoundDevice可能更合适,尤其是因为它支持NumPy数组。`pyaudio`和`sounddevice`都是用于Python中音频处理和流的库,允许用户通过他们的API录制、播放和处理音频数据。PyAudio 提供了 Python 绑定到 PortAudio,这是一个跨平台的音频I/O库。`sounddevice`库是基于PortAudio的,提供了一个简洁的Pythonic接口,用于录制和播放音频。
2024-01-04 17:25:19
541
原创 非洲 AI 不发达,看看这份PPT,受益匪浅
示例代码:https://github.com/langchain-ai/langchain/tree/master/templates/rag-chroma-multi-modal。示例代码:https://github.com/langchain-ai/langchain/blob/master/cookbook/Multi_modal_RAG.ipynb。项目地址:https://github.com/mayooear/gpt4-pdf-chatbot-langchain。
2024-01-03 14:05:56
1143
原创 叫板GPT-4的Gemini,我做了一个聊天网页,可图片输入,附教程
Gemini Nano(预览访问)为设备端体验而构建的最高效模型,支持离线使用场景。Gemini Pro(已推出)性能最佳的模型,具有各种文本和图像推理任务的功能。Gemini Ultra(预览访问)将于2024年初推出,用于大规模高度复杂文本和图像推理任务的最强大模型。Gemini Pro在八项基准测试中的六项上超越了GPT-3.5,被誉为“市场上最强大的免费聊天AI工具”。本文,我们使用的是Gemini Progemini-pro:针对仅文本提示进行了优化。
2024-01-02 20:59:55
1191
原创 微软真是活菩萨,面向初学者的机器学习、数据科学、AI、LLM课程统统免费
微软真是活菩萨,面向初学者的机器学习、数据科学、AI、LLM课程统统免费大家好,我是老章推荐几个质量上乘且完全免费的微软开源课程。
2024-01-02 20:56:22
2019
原创 微软的一些公开课,Python、机器学习、SQL、AI,全部免费
本课程是学习机器学习基础知识和用例的好方法。→ 11 个模块→ 2.5 小时→ 适合初学者→ 免费徽章链接: https://learn.microsoft.com/en-us/training/paths/intro-to-ml-with-python/学习一些基本技能并为其余课程做好准备。→ 06 模块→ 03 小时→ 适合初学者→ 免费徽章。
2024-01-02 20:53:46
1021
原创 机器学习项目精选 第一期:超完整数据科学资料合集
这个项目有点老,但是知识不老。地址:https://github.com/krishnaik06/The-Grand-Complete-Data-Science-Materials。苹果同时还公布了mlx应用示例:https://github.com/ml-explore/mlx-examples。地址:https://github.com/khangich/machine-learning-interview。地址:https://github.com/mistralai/client-python。
2023-12-17 22:28:36
1007
原创 87 GB 模型种子,GPT-4 缩小版,超越ChatGPT3.5,多平台在线体验
这种方法的工作原理是将复杂的任务划分为更小、更易于管理的子任务,每个子任务都由专门的迷你模型或“专家”处理。其前馈网络从 8 组不同的参数中挑选,在每一层,对每个词元,路由网络会选择两组“专家”参数来处理该词元,并将其输出叠加。2、门控网络:这是MoE架构的决策者。网络计算输入与每个专家之间的兼容性分数,然后使用这些分数来确定每个专家在任务中的参与程度。Mixtral 8x7B 是基于Mixture of Experts (专家混合,8x7B即 8 名专家,每个专家7B个参数 )的开源模型,
2023-12-17 21:59:27
2111
1
原创 小姐姐跳舞,AI 视频生成太酷了
第一个项目,SMPLer是一个从单眼输入进行 3D/4D 人体动作捕捉的通用基础模型,使用大规模的数据集学习人体姿态和形状的多样性,可以从互联网视频中提取人体、手势和脸部表情的复杂动作来制作虚拟角色的动画,在表达人体姿势和形状估计的七个基准上遥遥领先。简介:https://caizhongang.com/projects/SMPLer-X/项目:https://dreamoving.github.io/dreamoving/论文:https://arxiv.org/abs/2312.04966。
2023-12-17 21:56:04
1233
原创 一个神奇的Python库:Evidently,机器学习必备
Evidently是一个开源的 Python 工具,旨在帮助构建对机器学习模型的监控,以确保它们的质量和在生产环境运行的稳定性。它可以用于模型生命周期的多个阶段:作为 notebook 中检查模型的仪表板,作为 pipeline 的一部分,或者作为部署后的监控。Evidently 特别关注模型漂移,同时也提供了模型质量检查、数据质量检查和目标漂变监测等功能。此外,它还提供了多种内置的指标、可视化图形和测试,可以轻松地放入报告、仪表板或测试驱动的 pipeline 中。
2023-12-17 21:53:35
1111
原创 1文件+2个命令,无需安装,单机离线运行70亿大模型
llamafile是基于[llama.cpp](https://github.com/ggerganov/llama.cpp)(一个领先的开源 LLM 聊天机器人框架)和[Cosmopolitan Libc](https://github.com/jart/cosmopolitan)(一个开源项目,使 C 程序能够在大量平台和架构上编译和运行)实现的。llamafile简介:https://hacks.mozilla.org/2023/11/introducing-llamafile/
2023-12-08 22:42:05
687
原创 吴恩达最新短课,知识很硬核,附中英字幕
大家好我是老章,吴恩达老师忠实粉丝吴恩达新课,1.25倍速刷完了给吴恩达的最新短课加了中英文字幕最近吴老师又限时免费开放了一个短课:《构建和评估高级 RAG 应用程序》该课程由由 llama_index 和 truera_ai的 jerryjliu0和 datta_cs 教授主讲,门槛很低,有 Python 基础知识即可学习。官网没有中文字幕,所以我用ai翻译并重新压制了中英文字幕版上传B站了。
2023-12-06 11:35:41
1136
原创 我最喜欢的白版应用,AI加持的新功能开源!强烈推荐
Mermaid 是一个基于 Javascript 的图表绘制工具,通过解析类 Markdown 的文本语法来实现图表的创建和动态修改。选择Text to diagram即可,它的原理是使用AI将prompt指令转化为Mermaid,然后再从Mermaid转为diagram图。Excalidraw是一个虚拟白板应用,专门用于绘制类似手绘的图表。它提供了一个无限的、基于画布的白板,具有手绘风格,支持多种功能。最新Excalidraw开源了其文本到图表功能,允许用户输入文本描述,将其自动转换为相应的图表或图形。
2023-12-05 22:04:33
644
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人