自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(27)
  • 收藏
  • 关注

翻译 机器学习

机器学习算法课程定位、目标定位课程以算法、案例为驱动的学习,伴随浅显易懂的数学知识作为人工智能领域(数据挖掘/机器学习方向)的提升课程,掌握更深更有效的解决问题技能目标应用Scikit-learn实现数据集的特征工程掌握机器学习常见算法原理应用Scikit-learn实现机器学习算法的应用,结合场景解决实际问题机器学习概述了解机器学习定义以及应用场景什么是机器学习1、 背景介...

2019-04-22 22:01:20 1258 1

原创 AI的能力上限是使用者的认知

首先我们要了解AI,AI是什么,跟你的结合点在哪里?我们讲的AI大模型是说的大语言模型,也就是说人类说的话变成了一个指令,这是人类最简单的交互方式,也是最有效的交互方式,这就意味着我们跟机器打交道的方式要改变,以前那种界面交互的方式会改变,语言会作为一个输入来改变整个软件应用层。二、这意味未来所有的应用,我只要告诉我的客户端,我要做什么,AI来像人一样规划,一步步去执行,这就是我们说的智能,既然是智能,就难免会犯错,像人一样,任何人都会犯错,所以我们对AI的要求要像对人一样,要有包容心,把AI当人看。

2024-01-16 22:29:24 467

原创 问答机器人prompt

’‘将 Prompt 模板赋值’‘’val = velse:“, val)你是一个问答机器人。你的任务是根据下述给定的已知信息回答用户问题。确保你的回复完全依据下述已知信息。不要编造答案。如果下述已知信息不足以回答用户的问题,请直接回复"我无法回答您的问题"。请用中文回答用户问题。“”"defdef。

2024-01-12 21:26:46 693

原创 OpenAI Assistant API 内置RAG

【代码】OpenAI Assistant API 内置RAG。

2023-12-18 21:53:16 672

原创 openAi官方发布的promptEngineering方法

2023-12-18 12:22:38 388

原创 通过fu过 Function Calling 查询数据库

import os_ = load_dotenv(find_dotenv()) # 读取本地 .env 文件,里面定义了 OPENAI_API_KEtools=[{ # 摘自 OpenAI 官方示例 https://github.com/openai/openai-cookbook/blob/main/examples/How_to_call_functions_with_chat_models.ipynb“query”: {“”",

2023-12-16 21:25:55 1025

原创 GPT 魔力涌现

GPT。

2023-12-15 21:51:06 1084

翻译 机器学习中的相似性度量

在做分类时常常需要估算不同样本之间的相似性度量(Similarity Measurement),这时通常采用的方法就是计算样本间的“距离”(Distance)。采用什么样的方法计算距离是很讲究,甚至关系到分类的正确与否。本文的目的就是对常用的相似性度量作一个总结。本文目录:欧氏距离曼哈顿距离切比雪夫距离闵可夫斯基距离标准化欧氏距离马氏距离夹角余弦汉明距离杰卡德距离 & 杰卡德相似系数相关系数 & 相关距离信息熵欧氏距

2020-06-29 11:00:22 262

翻译 Apriori(关联分析算法)

终于到了机器学习实战的第十一章了,这也是继K-均值后的第二个无监督学习算法了。同样的该算法也是在一堆数据集中寻找数据之间的某种关联,这里主要介绍的是叫做Apriori的‘一个先验’算法,通过该算法我们可以对数据集做关联分析——在大规模的数据中寻找有趣关系的任务,本文主要介绍使用Apriori算法发现数据的(频繁项集、关联规则)。这些关系可以有两种形式:频繁项集、关联规则。 频繁项集:经常出现在一块的物品的集合 关联规则:暗示两种物品之间可能存在很强的关系一个具体的例子:频繁项集是指

2020-06-29 08:53:53 9283

原创 数据分析方法

数据分析的方法1、搭建指标体系前面讲到,要想了解企业的发展现状,就需要将各种业务数据收集起来,转化为各种指标,并最终汇聚成一个完整的指标体系。因为只有数据化,才能够相对客观。那么,什么样的指标体系才能准确反映企业的情况呢?这个问题我会在下一篇文章中详细解答。指标体系中,通常使用的都是基础的统计方法,如求和、求平均、计数、去重计数、占比分析、留存率等,然后再叠加各种维度分组,形成一个庞大的指标...

2020-02-26 09:12:02 807

原创 数据分析-数据会告诉我们什么?

本文主要讲述数据挖掘分析领域中,最常用的四种数据分析方法:描述型分析、诊断型分析、预测型分析和指令型分析。当刚涉足数据挖掘分析领域的分析师被问及,数据挖掘分析人员最重要的能力是什么时,他们给出了五花八门的答案。其实我想告诉他们的是,数据挖掘分析领域最重要的能力是:能够将数据转化为非专业人士也能够清楚理解的有意义的见解。使用一些工具来帮助大家更好的理解数据分析在挖掘数据价值方面的重要性,是十分...

2020-02-26 09:10:24 870

原创 自然语言关键词提取

关键词提取就是从文本里面把跟这篇文章意义最相关的一些词语抽取出来,在文献检索、自动文摘、文本聚类/分类等方面有着重要的应用。关键词提取算法一般分为有监督和无监督两类有监督的关键词提取方法主要是通过分类的方式进行,通过构建一个较为丰富和完善的词表,然后判断每个文档与词表中每个词的匹配程度,以类似打标签的方式,达到关键词提取的效果。优点是精度较高,缺点是需要大批量的标注数据,人工成本过高,并且词表...

2020-02-19 16:47:58 590

原创 浅谈数据挖掘

数据挖掘其实是一种深层次的数据分析方法。数据挖掘可以描述为:按企业既定业务目标,对大量的企业数据进行探索和分析,揭示隐藏的、未知的或验证已知的规律性,并进一步将其模型化的先进有效的方法。应用的技术包括:数据库技术、人工智能技术、数理统计、可视化技术、并行计算等方面。数据挖掘与传统的数据分析(如查询、报表、联机应用分析)的本质区别是数据挖掘是在没有明确假设的前提下去挖掘信息、发现知识。数据挖掘所...

2020-01-21 11:36:36 921

原创 文本数字化

文本数字化欢迎使用Markdown编辑器pd.Categorical(data[i]).labels你好! 这是你第一次使用 Markdown编辑器 所展示的欢迎页。如果你想学习如何使用Markdown编辑器, 可以仔细阅读这篇文章,了解一下Markdown的基本语法知识。新的改变我们对Markdown编辑器进行了一些功能拓展与语法支持,除了标准的Markdown编辑器功能,我们增加了如...

2019-12-04 15:17:27 1294

原创 离线安装tensorflow

由于某些原因,电脑不让联网,但需要用tensorflow框架,没办法只能离线安装tensorflow,实话能有网谁愿意入坑啊。本着屡败屡战的精神,本人试了网上的大多数方法,最后安装成功,并将此分享一下。1.尽量用python3.5(不要上来就给自己加难度)。2.最好用anaconda,这样好多库都不用自己去安,而且各个库之间的依赖连接的很好。本人用的是Anaconda3-4.2.0-win...

2019-11-05 09:42:10 291

翻译 深度学习简介

1.1 深度学习介绍学习目标目标知道深度学习与机器学习的区别了解神经网络的结构组成知道深度学习效果特点应用无1.1.1 区别区别1.1.1.1 特征提取方面机器学习的特征工程步骤是要靠手动完成的,而且需要大量领域专业知识深度学习通常由多个层组成,它们通常将更简单的模型组合在一起,通过将数据从一层传递到另一层来构建更复杂的模型。通过大量数据的训练自动得到模型,不需要人工设计...

2019-07-16 23:01:44 1516

原创 Pandas

Pandas的数据结构学习目标目标了解Numpy与Pandas的不同说明Pandas的Series与Dataframe两种结构的区别了解Pandas的MultiIndex与panel结构应用股票涨跌幅数据的修改1、Pandas介绍pandas2008年WesMcKinney开发出的库专门用于数据挖掘的开源python库以Numpy为基础,借力Numpy模块在计算方面性能高的...

2018-12-27 20:48:59 717

原创 机器学习 L1 L2正则化详解

正则化(Regularization)机器学习中几乎都可以看到损失函数后面会添加一个额外项,常用的额外项一般有两种,一般英文称作-norm和-norm,中文称作L1正则化和L2正则化,或者L1范数和L2范数。L1正则化和L2正则化可以看做是损失函数的惩罚项。所谓『惩罚』是指对损失函数中的某些参数做一些限制。对于线性回归模型,使用L1正则化的模型建叫做Lasso回归,使用L2正则化的模型叫做Ri...

2018-12-05 19:17:27 661

原创 TA-Lib 在linux下的安装

##TA-Lib 在linux下的安装sudo apt-get updatesudo apt-get install python3.6-dev装talib前要先装numpypython3.6 -m pip install numpy -i https://pypi.doubanio.com/simplewget http://prdownloads.sourceforge.net/ta...

2018-11-10 12:29:24 5161 1

原创 Django页面静态化的流程

引子在工作中接盘,遇到商城的首页被频繁访问(频繁查询数据库)导致宕机,但首页数据变动频率较低,如果通过静态html展示那么在访问速度会有很大的提升,并且对seo有很大帮助.理解页面静态化即将动态渲染生成的页面结果保存成html文件,放到静态文件服务器中。用户访问的时候访问的直接是处理好之后的html静态文件 对于页面中属于每个用户展示不同数据...

2018-09-27 14:42:33 1215

原创 python os和sys的区别

<os和sys的官方解释>➤os     os: This module provides a portable way of using operating system dependent functionality.    这个模块提供了一种方便的使用操作系统函数的方法。➤sys  &nb...

2018-09-18 08:59:40 154

翻译 Python中 Wxpy模块以及其监控

概述:  本文主要分享一下博主在学习wxpy 的过程中开发的一个小程序。博主在最近有一个监控报警的需求需要完成,然后刚好在学习wxpy 这个东西,因此很巧妙的将工作和学习联系在一起。  博文中主要使用到的技术设计到Python,Redis,以及Java。涉及到的技术看似很多,但是主要的语言是基于Python进行开发的。  架构涉及主要采用了 生产者消费者的涉及模式,使用Redis作为消息...

2018-09-16 13:41:52 3938

原创 python工具-setup.py

一、pip install 与 python setup.py install区别pip install 模块名:在线安装,会安装相关的依赖包。python setup.py install:下载源码后本地安装,不会安装依赖包。二、install 与 develop 的区别python...

2018-08-10 20:48:14 2643

原创 python基础-深拷贝、浅拷贝

一、“==”和 is“==”是比较两个对象是否相等,而不管是不是指向同一个地址is 是指不仅对象相等,而且指向的内存地址也相等。。(小整数对象池除外)二、浅拷贝和深拷贝浅拷贝:a = [1, 2, 3] b = a 拷贝后id(a)和id(b)相等。深拷贝:拷贝的内容相同...

2018-08-10 20:46:37 172

原创 python基础-format格式化

一、str.format()>>> "{} {}".format("hello", "world") # 不设置指定位置,按默认顺序'hello world'>>> "{0} {1}".format("hello", "wo

2018-08-10 20:44:34 408

原创 python设计模式-单例模式

单例模式(一)什么是单例模式 单例模式(Singleton Pattern)是一种常用的软件设计模式,该模式的主要目的是确保某一个类只有一个实例存在。当你希望在整个系统中,某个类只能出现一个实例时,单例对象就能派上用场。(二)实现单例的方法导入模块使用new方法使用装饰器...

2018-08-10 20:43:14 114

原创 python高級-代码优化

一、函数返回值缓存class memoization: known = dict() '''用这个装饰耗时0.5秒''' def __init__(self, fn): self.fn = fn def __call__(self, *args): ...

2018-08-10 20:41:12 119

基于langchain的RAG实战

基于langchain的RAG实战

2024-02-19

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除