贪玩懒悦-CSDN博客

原创用langchain+streamlit应用RAG实现个人知识库助手搭建

我搭建的是一个Prompt技术的AI学习助手（基于自己搭建的和Prompt技术有关的文章与书籍）。学习写Prompt需要一边写一边实践，否则就会“脑子说我会了，手说我废了”。平时看到好的Prompt，也会把它积累下来，也许哪天就能用上；在实践的时候，随着不断地修改，Prompt也会更新迭代；

2024-10-03 23:35:28 991

原创两种调用智谱AI API的方式

【代码】两种调用智谱AI API的方式。

2024-09-26 00:33:51 143

原创 Datawhale X 李宏毅苹果书AI夏令营深度学习笔记之——卷积神经网络的前世今生

卷积神经网络（Convolutional Neural Network, CNN）是一种深度学习模型，尤其擅长处理图像和视频等高维度的数据。CNN 通过模仿人类视觉系统的工作方式，自动学习数据中的空间层次结构，使得它在计算机视觉任务中表现出色，如图像分类、目标检测等。与传统的神经网络不同，CNN 通过引入卷积层和池化层，有效地减少了参数数量并提升了计算效率。卷积层使用可学习的过滤器（Filter）扫描输入数据，提取特征，而池化层则通过下采样减少数据维度，进一步压缩信息。

2024-09-03 23:55:59 987

原创 Datawhle X 李宏毅苹果书AI夏令营深度学习笔记：如何让你的模型更聪明地学习

在深度学习模型训练过程中，学习率是一个至关重要的超参数，可以把它看作是寻优过程中迈的步子大小。这个参数会影响到训练效率，以及模型是否能收敛。模型寻优时聪明不聪明很大程度上依赖学习率这个参数。上篇文章提到，训练模型时我们有时会头痛模型卡在critical point 训练不动了，随着迭代次数增加，损失函数不再下降，而且损失函数在该点梯度变得很小。但还有另外一种情况，随着迭代，损失函数不再下降，但是梯度却并没有变得很小，见下图的呈现情况，梯度的范数并没有维持在0附近的水平：这时候可能是步长这个参数的问题所致：

2024-08-31 13:43:44 698

原创 Datawhle X 李宏毅苹果书AI夏令营深度学习笔记之——局部最小值与鞍点

深度学习中优化神经网络是一个重要的问题，我们经常沮丧地发现到了一个节点，不管参数怎么更新，训练的损失都不会下降，神经网络似乎训练不起来了。这可能和损失函数收敛在局部最小值与鞍点有关。

2024-08-27 23:15:19 435

原创 DatawhaleX魔搭夏令营Kolors可图挑战赛Lora微调&ComfyUI工作流部署Task03

模型加载器（Load Checkpoint）：Load Checkpoint用于加载基础的模型文件，包含了Model、CLIP、VAE三部分。可以简单理解为在这里放训练好的模型文件。CLIP模块：CLIP模块将文本类型的输入变为模型可以理解的latent space embedding作为模型的输入。可以简单理解为这里是输入提示词的地方（正向和负向提示词。比如在绘图过程中大模型总是画不好手，你可以在负向提示词那一栏里加上一句：模糊扭曲的手）采样器。

2024-08-17 23:37:49 1017

原创 DatawhaleX魔搭夏令营Kolors可图挑战赛代码超级详细解释（小白也能看懂）Task02

可图Kolors大模型故事挑战赛baseline详细解析

2024-08-14 00:30:48 1026

原创 DatawhaleX魔搭夏令营可图Kolors-Lora风格故事挑战赛 task01笔记

可图Kolors故事挑战赛迷你漫画之《乒乓女将养成记》

2024-08-12 01:35:42 830

原创 sql语句case when常用查询总结

case when 是mySQL里面的控制流语句，和if…then…的分支判断逻辑很相似。case when语句有两种：（1）简单case when（2）case搜索函数法简单case when只能处理等式问题，case搜索函数法可以处理等式问题也可以处理不等式问题。case when的语法逻辑二、case when语句在业务中常见的几种用法2.1 数据映射处理比如将分类变量中每一个取值分别映射成0、1、2…5；所有用户的性别映射成0、1;或者把数值映射成具体的实际含义。如果是映射性别（0为女

2022-06-10 00:52:15 5154 1

原创殊途同归的两种角度理解岭回归(内含有sklearn例子)

在学习统计学专业课《回归分析技术》时学过岭回归，学机器学习时也涉及到岭回归，但是两个角度的思想方法略有不同，但最后的结果却是殊途同归的，最近准备统计学考研的复试时，对比了两种思路，觉得很有意思，把一些思考过程分享出来。角度一：统计学角度之下的岭回归1.1 岭回归要解决什么问题？岭回归的产生是为了弥补最小二乘估计的不足之处：（1）最小二乘估计要求数据满足基本假定条件（变量之间不相关，残差项零均值、等方差、不序列相关），但实际中，能满足这个要求的数据是很少的，尤其是经济数据，变量之间有很强相关性（2）

2022-03-16 10:07:21 2068

原创异常值挖掘方法——孤立森林Isolation Forest

异常值挖掘方法一、内容概览内容大致分为两大部分，第一部分是异常值挖掘方法概述，简略介绍异常值挖掘方法的分类及其优缺点。第二部分介绍孤立森林算法（iForest），Isolation Forest 简称 iForest，该算法是周志华在2010年提出的一个异常值检测算法，在工业界很实用，算法效果好，时间效率高。第二部分包括对iForest算法思想、原理、流程的介绍，以及来自sklearn官网上的一个iForest例子实战讲解，并附上代码与注释。二、异常值挖掘方法概述2.1统计量检验先对变量做一个描述

2022-03-16 10:00:03 4194

原创地理空间数据项目实战——共享单车停车需求识别与地图匹配

共享单车停车需求识别与地图匹配在我们日常生活中，大家都骑过共享单车，现在的共享单车app里面都有这样一个功能：在地图上规划出了很多的单车停放栅栏（停放点），用户需要把单车停在停放栅栏内，否则就要扣钱交调度费。但有时候停放栅栏的规划并不合理，城市里有些地区的停放栅栏比较密集，有些地方的停放栅栏却很稀疏，骑车骑到一个较远的地方，却找不到停放点，用户就只能多花钱，同样地，对于共享单车公司来说，停车栅栏规划的不合理，也加大了调度的人力时间。所以根据单车停放需求来… 就很重要。如果我们能识别出来某些停车需求量很

2022-03-14 22:15:32 4765 9

原创主成分分析学习笔记+sklearn人脸识别例子

降维算法之PCA一、降维算法概述高维数据不易于存储与分析，在处理高维数据之前往往要对其进行维归约，也叫降维。在高维数据中，必然有些特征是不带有有效的信息的（比如噪音），或者有些特征带有的信息和其他些特征是重复的（比如些特征可能会线性相关）。我们希望能够找出种办法来帮助我们衡量特征上所带的信息量，让我们在降维的过程中，能够即减少特征的数量，又保留大部分有效信息将那些带有重复信息的特征合并，并删除那些带无效信息的特征等等逐渐创造出能够代表原特征矩阵大部分信息的，特征更少的，新特征矩阵。维归约算法大致

2022-03-01 20:58:22 898

原创数据预处理流程

数据预处理流程总结下面分享一下自己通常会用到的一些数据预处理的方法和步骤，用Kaggle平台上的elo用户忠诚度预测的数据集作为应用案例。import numpy as npimport pandas as pdimport matplotlib.pyplot as pltplt.rcParams['font.sans-serif']=['SimHei']merchant = pd.read_csv(r'\原始数据\elo-merchant-category-recommendation\me

2022-03-01 17:47:23 4299

原创数据分布探索函数（可以直接调用）

在建模之前要对数据进行探索性分析，首先要对数据分布有一个大致了解。matplotlib里面有自带的hist()函数，直接data.hist()，全部特征的分布状态就能在一张画布上展示出来，对于一个样本量较小的数据集来说，非常方便（700多个样本，60几个特征）。比如这样：在一个样本量为300多万的数据集上面跑了一下，效果也还可以，优点是速度真的很快（对比后面自己写的那个函数）。但是真的没法看得很精细。比如这个数据集的几个特征分布图都有这样的特点(拿第一行第四幅图举例)：大量数据集中在0附近，往后就空空如

2022-02-25 17:23:19 3351

fengjiandaxia的博客

原创用langchain+streamlit应用RAG实现个人知识库助手搭建

原创两种调用智谱AI API的方式

原创 Datawhale X 李宏毅苹果书AI夏令营深度学习笔记之——卷积神经网络的前世今生

原创 Datawhle X 李宏毅苹果书AI夏令营深度学习笔记：如何让你的模型更聪明地学习

原创 Datawhle X 李宏毅苹果书AI夏令营深度学习笔记之——局部最小值与鞍点

原创 DatawhaleX魔搭夏令营Kolors可图挑战赛Lora微调&ComfyUI工作流部署Task03

原创 DatawhaleX魔搭夏令营Kolors可图挑战赛代码超级详细解释（小白也能看懂）Task02

原创 DatawhaleX魔搭夏令营可图Kolors-Lora风格故事挑战赛 task01笔记

原创 sql语句case when常用查询总结

原创殊途同归的两种角度理解岭回归(内含有sklearn例子)

原创异常值挖掘方法——孤立森林Isolation Forest

原创地理空间数据项目实战——共享单车停车需求识别与地图匹配

原创主成分分析学习笔记+sklearn人脸识别例子

原创数据预处理流程

原创数据分布探索函数（可以直接调用）

原创建模数据内存管理代码块——打kaggle经常用得上的代码

原创 Kaggle上分技巧——单模K折交叉验证训练+多模型融合

原创 python导入、导出csv文件的方法

原创随机森林学习笔记

原创矩阵计算学习日记（1)（未完待续）

原创随机抽样之CDF逆变换法（未完待续）

原创决策树原理与sciki-learn实战

原创如何在Anaconda中安装lightgbm

空空如也

空空如也