ErbaoLiu-CSDN博客

原创徒手实践深度学习完整项目（一）——图像识别（基于深度学习框架TensorFlow2.0、Keras，含构建原理、代码和部署细节）

目录CIFAR-10数据集简介项目环境项目实践项目部署CIFAR-10数据集简介官网下载地址：《CRFAR-10数据集》 CIFAR-10数据集由Alex Krizhevsky, Vinod Nair和Geoffrey Hinton收集。如图：一共包含10 个类别的RGB 彩色图片：飞机（ airplane ）、汽车（ aut...

2020-04-17 20:42:40 946

原创 word2vec和doc2vec模型详解及应用

词袋模型（Bag of Word Model）将所有词语装进一个袋子里，不考虑其词法和语序的问题，即每个词语都是独立的。例如如下2个例句：Jane wants to go to Shenzhen.Bob wants to go to Shanghai.就可以构成一个词袋，袋子里包括{ Jane，wants，to，go，Shenzhen，Bob，Shangh...

2020-04-11 19:13:03 1646 1

原创 Java死锁分析（jstack、jconsole、JProfiler、Linux和Windows）

死锁代码示例/** * Created by leboop on 2019/1/16. */public class DeadLock implements Runnable { private String a = ""; private String b = ""; public DeadLock(String a, String b) { ...

2019-01-16 22:29:52 1977

转载模拟登录（Python）

"""模拟登录"""import requestsfrom lxml import etreeEMAIL = '********'PASSWORD = '********'class Login(object): def __init__(self): self.session = requests.Session() self.head...

2019-01-14 18:58:00 2141 1

原创验证码识别（Python）

图形验证码识别图形验证码最早出现，也很常见，一般由4个字母或者数字组成。例如，中国知网注册页面采用的就是图形验证码，链接为http://my.cnki.net/elibregister/commonRegister.aspx，页面如下：该注册页面表单最后一项就是图形验证码，必须正确输入图形验证码才可以完成注册。该图形验证码其实是一张图片，上面是经过变形的4个大写字母，并...

2019-01-10 13:06:13 1708

原创机器学习之支持向量机SVM（理论基础）

本文符号约定参见《机器学习之矩阵微积分及其性质》。考虑如下一般形式的约束优化问题（constrained optimization problem）： ...

2018-12-22 01:44:52 2737 1

原创 Linux系统安装Python3环境（超详细）

本文基于如下Linux系统版本：1、默认情况下，Linux会自带安装Python，可以运行python --version命令查看，如图：我们看到Linux中已经自带了Python2.7.5。再次运行python命令后就可以使用python命令窗口了（Ctrl+D退出python命令窗口）。2、查看Linux默认安装的Python位置看到/usr/bin/python...

2018-12-05 14:31:15 224693 78

原创 Spark 2.3.0 Structured Streaming详解

一、什么是Structured Streaming 结构化流（Structured Streaming）是一个建立在Spark SQL引擎之上可扩展且容错的流处理引擎。你可以使用与静态数据批处理计算相同的方式来表达流计算。当不断有流数据到达时，Spark SQL引擎将会增量地、连续地计算它们，然后更新最终的结果。最后，系统通过检查点和预写日志的方式确保端到端只执行一次的容错保证。...

2018-08-13 21:29:19 10237 1

原创 Quinlan C4.5剪枝U(0,6)U(1,16)等置信上限如何计算？

f可以是E/N，有时候用修正的f=(E+0.5)/N。猜测Quinlan使用是f=(E+0.5)/N，而且使用了如下两个值进行线性插值计算。之前看到Quinlan中关于C4.5决策树算法剪枝环节中，关于错误率e置信区间估计，为啥。当E=0时，U(0,1)=0.75，U(0,6)=0.206，U(0,9)=0.143？本文将给出本作者的一个大胆猜测。（2）对于E不为0的情况。

2025-01-15 20:32:56 461

原创公开-自动数据挖掘与分析实操代码（免费领取）

本项目旨在自动实现数据挖掘与分析全流程，为用户更快速、精准洞察数据价值。凡订阅如下专栏之一的读者：自然语言处理&大模型数据分析&大模型机器学习&大模型均可免费领取自动数据挖掘与分析实操完整代码。自动数据分析模块主要分为：1、数据接入2、数据探索3、数据处理4、数据切分5、数据模型（模型选择、数据建模、模型评估、模型调优、模型预测）。

2024-11-06 15:06:52 956

原创自动数据挖掘与分析实操代码（免费领取）

本项目旨在自动实现数据挖掘与分析全流程，为用户更快速、精准洞察数据价值。凡订阅如下专栏之一的读者：自然语言处理&大模型数据分析&大模型机器学习&大模型均可免费领取自动数据挖掘与分析实操完整代码。自动数据分析模块主要分为：1、数据接入2、数据探索3、数据处理4、数据切分5、数据模型（模型选择、数据建模、模型评估、模型调优、模型预测）。

2024-11-06 12:53:20 276

CRISP-DM（Cross-Industry Standard Process for Data Mining）是一种广泛使用的数据挖掘过程框架，由SPSS公司提出。SEMMA（Sample, Explore, Modify, Model, and Assess）是另一种数据挖掘方法论，由SAS公司提出。数据库知识发掘（Knowledge Discovery in Database，KDD）是从数据库中的大量数据中发现不明显、之前未知、可能有用的知识。（data mining）和。

2024-10-29 10:14:06 622

原创 ChatGLM + LangChain + Gradio构建前后端分离的大模型应用程序

ChatGLM-6B中英双语对话大模型Windows本地部署实战-CSDN博客LangChain是一个用于开发由大型语言模型（llm）支持的应用程序的框架。LangChain简化了LLM应用程序生命周期的每个阶段：（1）开发：使用LangChain的开源构建块组件和第三方集成来构建应用程序。使用LangGraph构建具有一流的流和人在循环支持的有状态代理。（2）产品化：使用LangSmith来检查、监控和评估您的链，以便您可以自信地持续优化和部署。

2024-10-28 11:35:26 378

原创 ChatGLM-6B LoRA微调实战（含完整代码）

本文将使用LoRA微调方法对ChatGLM-6B大模型进行微调。

2024-10-24 15:03:38 673

原创 ChatGLM-6B大模型 + Bert预训练模型 + RAG实现知识库信息抽取（含完整代码）

‌本文将基于ChatGLM-6B大模型、Bert预训练模型和RAG完整金融知识库信息抽取任务。

2024-10-21 22:01:05 652

原创 ChatGLM-6B和Prompt搭建专业领域知识问答机器人应用方案（含完整代码）

本文基于ChatGLM-6B大模型和Pompt提示工程搭建医疗领域知识问答机器人为例。

2024-10-21 10:47:43 1052

原创连接不上hugging face的解决方法

【代码】连接不上hugging face的解决方法。

2024-10-20 12:44:17 1293

原创 ChatGLM-6B中英双语对话大模型Windows本地部署实战

ChatGLM是智谱清言大模型的开源版本，目前有ChartGLM、ChatGLM2、ChatGLM3和GLM-4版本。ChatGLM：GitHub - THUDM/ChatGLM-6B: ChatGLM-6B: An Open Bilingual Dialogue Language Model | 开源双语对话语言模型简介：中文领域效果最好的开源底座模型之一，针对中文问答和对话进行了优化。经过约 1T 标识符的中英双语训练，辅以监督微调、反馈自助、人类反馈强化学习等技术的加持。

2024-10-19 16:55:23 945

翻译 PyTorch从零实现和可视化Transformer注意力（Additive Attention、Scaled Dot Product Attention、Multi-Head Attention）

上面公式没有体现批量操作，每个矩阵可以添加batch_size维度，例如Q的维度为(batch_size,n,d)。

2024-10-16 10:55:15 703

原创使用PyTorch从0实现Fashion-MNIST数据集分类

【代码】使用PyTorch从0实现Fashion-MNIST数据集分类。

2024-10-12 20:37:00 603

原创 Windows11安装CUDA、cuDNN、PyTorch详解

‌cuDNN（CUDA Deep Neural Network library）是一个由NVIDIA开发的深度学习GPU加速库，旨在为深度学习任务提供高效、标准化的原语（基本操作）来加速深度学习框架在NVIDIA GPU上的运算。此外，PyTorch还具有高度的灵活性和可扩展性，支持多种硬件平台，并且有一个活跃的社区，提供了大量的教程和资源，使得用户可以快速上手并解决实际问题。PyTorch的核心特点包括：‌12。可以看到NVIDIA GPU驱动版本为546.56，支持的CUDA最高版本为12.3。

2024-10-12 08:33:59 25082 13

原创使用keras搭建GRU神经网络创作莎士比亚小说

【代码】使用keras搭建GRU神经网络创作莎士比亚小说。

2024-10-08 15:55:50 393

原创使用keras-tuner微调神经网络超参数

本文将介绍keras-tuner提供了三种神经网络超参数调优方法。它们分别是随机搜索RandomSearch、HyperBand和贝叶斯优化BayesianOptimization。

2024-10-06 10:16:55 507

原创使用TensorBoard可视化模型

TensorBoard是一款出色的交互式的模型可视化工具。安装TensorFlow时，会自动安装TensorBoard。

2024-10-05 22:02:07 625

原创 Ollama本地私有化部署通义千问大模型Qwen2.5

Qwen是阿里巴巴集团Qwen团队的大型语言模型和大型多模态模型系列。现在大型语言模型已经升级到Qwen2.5。语言模型和多模态模型都是在大规模多语言和多模态数据上进行预训练的，并在符合人类偏好的高质量数据上进行后训练。Qwen具有自然语言理解、文本生成、视觉理解、音频理解、工具使用、角色扮演、人工智能代理等功能。在Qwen2发布的过去三个月里，许多开发人员在Qwen2语言模型上构建了新的模型，向我们提供了宝贵的反馈。在此期间，我们专注于创建更智能、知识更丰富的语言模型。

2024-09-26 14:39:40 6086

原创机器学习实战—天猫用户重复购买预测

商家有时会在特定日期，例如节礼日（Boxing-day），黑色星期五或是双十一（11月11日）开展大型促销活动或者发放优惠券以吸引消费者，然而很多被吸引来的买家都是一次性消费者，这些促销活动可能对销售业绩的增长并没有长远帮助，因此为解决这个问题，商家需要识别出哪类消费者可以转化为重复购买者。通过对这些潜在的忠诚客户进行定位，商家可以大大降低促销成本，提高投资回报率（Return on Investment, ROI）。众所周知的是，在线投放广告时精准定位客户是件比较难的事情，尤其是针对新消费者的定位。

2024-09-18 22:27:02 1158

第7章-使用统计方法进行变量有效性测试-7.2.2-多因素方差分析

空空如也