小白的数据-CSDN博客

原创 langchain新版本v0.2文档：tutorials（1）

（2）文档中采用的是chatModel（聊天模型，交互式的对话）作为案例，与之对应的是LLM（大语言模型，文本生成和补全）。接下来会展示二者输出的差异。（1）文档中的案例采用了openai模型，作者学习时采用的是本地部署的qwen。将把文本从英语翻译成另一种语言。langchain表达语言、

2024-07-13 16:08:31 256

原创 langchain学习（十三）

并行,每个值都是用RunnableParallel的整体输入调用的,使前一个输出格式匹配下一个输入。

2024-05-22 12:24:46 580

原创 win10部署本地大模型langchain+ollama

（3）在系统变量中新建一个OLLAMA_MODELS的变量，位置根据其他盘的存储空间去设置，比如在ollama的文件夹下（D:\Ollama\models）（2）修改环境变量的用户变量，将PATH变量中的C:\Users\XX\AppData\Local\Programs\Ollama修改为步骤（1）的位置。（1）将C:\Users\XX\AppData\Local\Programs\Ollama这个文件夹移动到其他盘（D:\Ollama）下载的模型默然安装在C:\Users\XX\.ollama。

2024-05-03 11:03:13 2318

原创 langchain学习（十二）

各类memory

2024-03-13 17:42:31 501

原创 langchain学习（十一）

对话、记忆、历史信息

2024-03-04 17:26:41 1522

原创 langchain学习（十）

Bind runtime args

2024-03-02 18:13:02 554

原创 langchain学习（九）

基于输入的动态路由逻辑，通过上一步的输出选择下一步操作，允许创建非确定性链。路由保证路由间的结构和连贯。有以下两种方法执行路由。

2024-03-02 11:56:00 715

原创 langchain学习（八）

Run custom functions

2024-03-01 17:44:58 733

原创 langchain学习（七）

RunnablePassthrough

2024-03-01 17:22:46 1723

原创 langchain学习（六）

itemgetter函数是Python内置的函数库operator中的一个函数，其功能是返回可调用对象，这个对象会从其参数中提取指定的值。在chain中，runnables模块中的RunnablePassthrough可用于格式化上一个输出，从而匹配下一个输入的需要的格式。在langchain_core.runnables模块下。langchain中的一些操作和控制。以下3个方式是等效的。

2024-02-25 20:27:41 1016

原创 langchain学习（五）

langchain streaming

2024-02-25 14:38:02 803 1

原创 google-gemma本地测试

用户： Write me a poem about the Lantern Festival.本地配置：win11、RAM16G、cpu、python3.8。gemma-2b版本都要14G。测试发现带不太动、中文不太行。

2024-02-24 22:28:21 551

原创 langchain学习（四）

方式1通过RunnableParallel。2、component的输入输出类型表。1、langchain采用了一个叫。Interface官方文档。同时提供以上接口的异步方式。方式2通过batch接口。：流式（实时）返回结果。：通过列表进行多输入。

2024-02-24 10:07:10 856

原创 langchain学习（三）

model.invoke(prompt_value)，如果model是chatModel（通过from langchain_openai import ChatOpenAI），输出的是message格式（AIMessage(content="XX")），如果model是LLM（from langchain_openai.llms import OpenAI），输出格式是字符串，可用（from langchain_core.messages import AIMessage）转换为message格式。

2024-02-23 12:18:16 808

原创 langchain学习（二）

LangChain Expression Language：LCEL，langchain表达式语言，从设计之处就支持将原型投入生产而不用修改代码为什么用langchain（而不直接调用LLM），官方文档给出以下的原因1、“get the best possible time-to-first-token (time elapsed until the first chunk of output comes out)”--最低的平均首包延迟。时长少更少的围绕潜在延迟问题或缓慢响应的设计工作。

2024-02-23 11:05:57 450

原创 langchain学习（一）

参考官方文档的quickstart。

2024-02-22 15:40:06 1033

原创 langchain、openai使用问题记录

-----------------------2024年2月25日更新-----------------------------------------------------------------------------retrieval_chain要求传入prompt中用input,否则报错KeyError: 'input'，retrieval_docs = (lambda x: x["input"]) | retriever。解决方案目前是改用旧版的调用方式，会出现警告。

2024-02-19 21:48:04 1934

原创 Learning Apache Spark with Python:regression

在线学习：当新数据点到来时，模型即时地进行更新。常用于那些数据持续流入的应用，如金融市场预测、实时广告投放等。随机梯度下降（单个样本），用以在线学习。小批量梯度下降（部分样本）批量梯度下降（全样本）

2023-08-11 15:08:29 17

原创 Learning Apache Spark with Python:dataExploManipu

Spearman correlation斯皮尔曼秩相关系数：变量间非线性/非正态分布/非数值型，对异常值不太敏感。卡方检验是针对自变量和因变量都是分类数据，pvalue小于0.05显著相关。FeatureHasher：应对高基数特征（分类字段下的唯一值多）卡方检验：推断总体分布与期望分布或理论分布是否有显著差异。1、sparkDataFrame转numpy。CountVectorizer：一般词袋模型。独立样本t检验、配对样本t检验、方差分析。Word2Vec：神经网络模型。

2023-08-10 11:55:53 20

原创广义数据分析方向总结

虽然不直接参与分析、算法或者开发的工作，但需要了解整个数据流程、相关的技术，同时也要有相关的行业经验经营。重点是挖掘出深层次的知识，与商业分析比较，商业分析的因果大多有直接链路，表象可见的，而数据挖掘则是要找出间接的、不那么明显的。DAMA数据管理体系中的元数据管理、主数据管理、数据质量管理、数据安全管理、……数据标准的制定、数据库设计的规范、数据质量的保障方法、元数据定义、数据统计口径、血缘关系、……概率分布、假设检验、方差分析、回归建模、时间序列预测、……PEST、5W2H、逻辑树、4P、……

2022-08-10 08:33:02 60

小白的数据博客

原创 langchain新版本v0.2文档：tutorials（1）

原创 langchain学习（十三）

原创 win10部署本地大模型langchain+ollama

原创 langchain学习（十二）

原创 langchain学习（十一）

原创 langchain学习（十）

原创 langchain学习（九）

原创 langchain学习（八）

原创 langchain学习（七）

原创 langchain学习（六）

原创 langchain学习（五）

原创 google-gemma本地测试

原创 langchain学习（四）

原创 langchain学习（三）

原创 langchain学习（二）

原创 langchain学习（一）

原创 langchain、openai使用问题记录

原创 Learning Apache Spark with Python:regression

原创 Learning Apache Spark with Python:dataExploManipu

原创广义数据分析方向总结

原创 ES中根据时间类型字段的按日期聚合方法

原创 keras问题记

原创 win10：hadoop、hive、mysql、spark搭建问题记录

原创 keras+lstm+crf命名实体识别code

原创 keras+lstm+crf命名实体识别

原创 keras_contrib使用过程的一些问题

原创 python调用crf接口+信息抽取

原创用crf++工具进行自定义领域命名实体识别

原创微信公众号文章迁移至其他平台的自动化

原创商品评论分析2

原创 OpenCV 图像处理学习

原创商品评论分析1

空空如也

空空如也