LLM应用开发与落地_前行的七哥的博客-CSDN博客

LLM应用开发与落地

关注

文章平均质量分 81

关注数：文章数：6 文章阅读量：6258 文章收藏量：82

作者: 前行的七哥

我是前行的七哥，在大厂，中厂待过，也曾创过业；带过100多人的团队，也曾融过几亿人民币。我有十多年的技术和管理经验，现在一家互联网上市公司担任技术负责人，目前个人重点研究AI，特别是LLM应用落地。欢迎联系我，一起交流，共同前行！

展开

这么多向量数据库，它们之间到底有哪些差异？

向量数据库之间看似都一样，但细细比较还是有很多不同的。

原创 2024-02-24 16:01:46 · 606 阅读 · 0 评论
LLM应用开发与落地：chroma的近似搜索问题

选择向量数据库还是要看下索引实现方式，是否支持量化索引，近邻搜索准确率和响应速度，最好是支持参数调整的，可以在不同场景设置不同参数。

原创 2024-02-19 21:01:40 · 584 阅读 · 0 评论
LLM应用开发与落地：《哄哄模拟器》爆火后我的一些思考

LLM的应用必然越来越普及，这是一个全新的赛道和机会。随着LLM的进一步发展，LLM的能够落地的应用场景必定也会越来越多。

转载 2024-01-25 19:38:47 · 288 阅读 · 0 评论
LLM应用开发与落地：基于上下文的文本信息检测与提取

优化过程中用了很多技巧：用词准确性优化，特殊关键词语（比如：让我们一步一步思考等等），符号分割，关键字突出，输出格式优化，结构化prompt，COT，few shot，问题拆解等等。这句话中既没有用户的当前位置信息，也没有当前的年龄信息，但是如果你用关键字“我在”和“岁”去匹配，可能会匹配出位置“深圳”和年龄“24”，但这并不是用户当前的位置和年龄信息，属于误判。但是，接进来容易，实测起来发现问题不少：LLM幻觉导致的误判，prompt过长导致的成本，以及用户输入的敏感字符导致触发LLM的安全规则等等。

原创 2024-01-27 10:10:27 · 984 阅读 · 0 评论
LLM应用开发与落地：使用gradio十分钟搭建聊天UI

即使你是做前端开发的，你也可以尝试一下Gradio，哪天有人给你提了一个调试界面的需求，原本要半天的工作现在只需要十分钟了，多余的时机用来学习或享受生活，多美（或者，你让后端自己用Gradio搞一个，嘿嘿）。是的，它可不是只适用于LLM的，其他方面感兴趣的大家可以进一步去研究，我这里只聊创建用于测试和验证 LLM 应用的聊天界面。加入以上代码后，你跟之前一样启动你的fastapi后端，然后访问 http://you.domain.name/gradio_chat ，你就可以看到一个聊天机器人界面。

原创 2024-02-03 09:37:53 · 2706 阅读 · 1 评论
LLM应用开发与落地：流式响应

我们在微信需要发送比较长一段文字的时候，我们需要花比较长的时间去写，跟你聊天的人那边的感触就是要有一段时间的等待。最近感悟就是，简单的RAG也好，让人惊喜的AGI也好，都非常容易实现，但是真正要落地到企业中，非常多的坑和需要探索解决的东西，无论是准确率、响应速度、成本，以及使用人的接受度等等。，应用服务器跟LLM服务器间的数据通道需要支持流式响应，一般http接口的封装都有这个参数，比如python request包的post方法的stream参数。看的的效果就是“你输入：”后边的字一个一个显示出来。

原创 2024-02-09 22:56:00 · 1092 阅读 · 0 评论

LLM应用开发与落地

作者: 前行的七哥

这么多向量数据库，它们之间到底有哪些差异？

LLM应用开发与落地：chroma的近似搜索问题

LLM应用开发与落地：《哄哄模拟器》爆火后我的一些思考

LLM应用开发与落地：基于上下文的文本信息检测与提取

LLM应用开发与落地：使用gradio十分钟搭建聊天UI

LLM应用开发与落地：流式响应