自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(22)
  • 收藏
  • 关注

原创 【大模型和智能问答系统】

大模型如何在智能对话领域应用,大模型能完全取代传统智能对话吗?

2023-09-29 00:50:36 1784

原创 triton部署 python backend 输入字符串

背景:最近在做智能对话项目,用triton进行模型的部署和管理。triton 除了部署模型外,还支持.py文件的推理。根据项目需求,需要将自定的python代码,作为模型部署到triton中,且模型的输入是文字。输出的结果是分词结果。准备:1.triton 21.12镜像2.容器中安装 LAC库。百度分词库。pip install lac -i https://mirror.baidu.com/pypi/simple操作:1、在模型仓库下,创建如图所示的目录结构;lac – 模型名称,在

2022-05-25 14:25:19 3568 2

原创 gradient_accumulation_steps --梯度累加理解

参考:https://blog.csdn.net/Princeicon/article/details/108058822https://blog.csdn.net/weixin_43643246/article/details/107785089假设情景:batch_size = 10 #每批次大小total_num = 1000 #数据总量按照 训练一个批次数据,更新一次梯度;训练步数 train_steps = 1000 / 10 = 100梯度更新步数 = 1000 / 10 = 1

2021-12-23 16:50:25 4103 2

原创 动态本体 palantir

102解析器与106本体耦合,106本体与108数据库耦合;106本体有一个或多个110对象类型和116属性类型110对象类型实例化多个112对象每一个对象有一个或多个属性116属性类型实例化114A和114B属性116属性类型有一个或多个118组件,组件有字符串、数字等120基本类型(location)实例化116属性类型(home)124 对象类型编辑器创建110对象类型126属性类型编辑器创建116属性类型在126属性类型编辑器创建116属性类型时,至少要用到一个122解析器编辑器.

2020-12-23 20:48:12 1945 2

原创 java正则化,返回同一字符串多处匹配结果。

1、需求:正则化匹配时,正则表达式pattern,需要匹配字符传string中的多处,并将没一处的位置信息返回!2、代码:import java.util.ArrayList;import java.util.HashMap;import java.util.regex.Matcher;import java.util.regex.Pattern;public class test { public static void main(String[] args) {

2020-10-20 19:43:10 1320

原创 from bert import modeling,报错“module ‘bert‘ has no attribute ‘modeling‘”

背景:tensorflow版本:2.21查询方法:import tensorflow as tf tf.__version__bert安装方式:pip install bert问题+解决方法问题1.tensorflow的版本不匹配;解决:将tensorflow的版本降低为1.15.0:install tensorflow==1.15.0 -ihttp://pypi.douban.com/simple --trusted-host pypi.douban.com解释:更新tensor

2020-08-26 16:39:22 3069 2

原创 python的广播机制(broadcasting)

1.python的广播机制什么?原理:两个数组的后缘维度相同,或者在其中一方的维度为1。广播在缺失或者长度为1的维度上补充。2.python的广播机制是做什么用的?对缺失维度进行补充,可以减小代码量;3.举例阐述一下python的广播机制。后缘维度:A为(3,4,5)的三维数据,B为(4,5)的二维数组。由于A和B的后缘维度都为(4,5),所以可以进行广播机制。同理:A为(3,4)的二维数组,B为(4,)的1为数组,他们的后缘维度都是4,所以可以进行广播。其中一方维度为1:A为(4,5)的三维

2020-08-07 23:00:02 9744 2

原创 pd.read_csv()时,报错:‘utf-8‘ codec can‘t decode byte 0xa5 in position 1124: invalid start byte

1,打开csv文件时,总是报错:后面加:encoding=“utf-8”也有其他位置报错。train=pd.read_csv("C:/AI/数据/pair question/quora-question-pairs/train/train.csv",encoding="utf-8")问题:csv文件的编码格式与python读入文件的指定的encoding参数不一致,encoding参数默认为 utf-8。解决方案:将csv文件重新编码保存将.csv文件保存一下,然后鼠标右击打开方式记事本。然后,

2020-07-19 00:47:59 1137

原创 win10设置Python程序定时运行任务(列一下自己遇到的问题)

在win10上,做python定时执行任务。第一步:打开控制面板;(按win键后,输入“控制面板”)第二步:控制面板右上角,“查看方式”选择“大图标”;第三步:选择“管理工具”;第四步:选择“计划任务程序”;第五步:右键”任务计划程序库“,选择”创建基本任务“;下面为创建自动化脚本步骤,参考博客:第六步:创建基本任务触发器解释下三个参数:【程序或脚本】文本框中填的是Python编译器的名称,一般就是python.exe,【起始于】文本框中填的是Python编译器的目录,上图中假设

2020-07-13 11:31:41 1307 1

原创 mysql在数据库中创建工作表时,总是报语法错误。(表名字符号有问题)

表名字和字段外面的符号不是引号!!!!是键盘上面,tab键上面的反引号!!!··········································,就是这玩意。反引号是为了区分 MySql 关键字与普通字符而引入的符号,一般的,表名与字段名都使用反引号。...

2020-05-12 10:43:50 2164 1

原创 本地下载mysql 8,使用navicat登陆时,报错:1045 - acess denied for user "root"@"localhost"

PS:按照加粗字体操作,即可解决,其他内容记录下遇到的坑。1.根据介绍,该问题是由于root用户没有赋权导致。进行赋权操作:首先登陆服务器:在cmd命令行(管理员身份),输入命令:mysql -uroot -p ;输入密码进入mysql。网上大部分介绍使用命令:grant all privileges on . to root@‘localhost’ identified by “123456”;赋权操作。输入完命令后,遇到报错:1064 - You have an error in you

2020-05-09 01:38:30 450

原创 anaconda下安装tensorflow过慢,导致安装失败

问题:电脑重新安装tensorflow,由于国内清华等一些镜像网站已经不能访问,必须在默认的下载地址进行下载,速度很慢,经常断掉下载不下来。解决:要安装tensorflow,首先要建立一个python3的虚拟环境,按照开始的建立方法,下载太慢,一直没有下载下来。参照了这篇文章:https://blog.csdn.net/qq_44639795/article/details/1006931...

2020-03-26 10:50:42 7288 6

原创 pandas读取数据时,报错UnicodeDecodeError: 'utf-8' codec can't decode byte 0xce in position 0: invalid contin

1.我的代码:df_train=pd.read_csv("C:\\Users\\15520\\Desktop\\AI\\阿里天池\\幸福感挖掘\\happiness_train_complete.csv")但读取同样位置的另一个文件,就没有这种错误:abbr_train_data=pd.read_csv("C:\\Users\\15520\\Desktop\\AI\\阿里天池\\幸福感挖掘...

2020-02-27 10:51:33 1238

原创 xgboost库在anaconda下的安装

环境:win10 64位+python 3.7xgboost包下载地址:https://www.lfd.uci.edu/~gohlke/pythonlibs/#xgboost我下载到自己电脑地址:C:\Users\15520\Desktop\AI\anaconda\xgboost下载完成后,打开anaconda操作界面:切换到对应目录:cd C:\Users\15520\Deskto...

2020-02-25 09:17:32 318

原创 excel中单元格中的null,在pandas导入到程序中,全部识别为nan,空值。

在做阿里天池的o2o消费者用券行为预测时,对于数据中的没有数据的值,其全部用“null"表示了。 将该数据导入到程序中,其全部显示为Nan。该位置的数据类型,用isnull函数判断,为空值。...

2020-01-10 22:09:17 1195 1

原创 机器学习-逻辑回归

#原理逻辑回归是分类问题。对x的输入特征进行学习,输出y值属于哪一类的分类算法。比如:在titanic机器学习中,给出乘客的姓名/年龄/性别等一系列的值(X的值),通过对一些列值的学习,得出最终乘客是幸存还是死亡(最终的y值是0还是1,0代表死亡,1代表幸存)。首先,y=wx+b,这是最基本的线性公式。即x和y呈现线性对应关系。.但是,在很多实际问题处理时,输入变量x和输出变量y之间,是...

2019-12-17 21:43:23 297

原创 ValueError: Input contains NaN, infinity or a value too large for dtype('float32').

问题:在机器学习做titanic时,报错ValueError: Input contains NaN, infinity or a value too large for dtype(‘float32’).原因:因为在输入数据时,有的列中的数据为空,导致报错。用np.isnan(titanic[x]).any() 检查相应的列是否为空,如果有为空的值就返回True,否则返回false。p...

2019-11-30 23:49:22 1693

原创 kaggle-Titanic训练-线性回归法算法

处理数据:import pandas as pdtitanic=pd.read_csv("C:/Users/15520/Desktop/AI/kaggle/titanic/train.csv")# titanic.describe()#descrbie()函数只描述含有数据的列,对"sex"这样的列没有描述#"age"列的数据有缺失,用平局值填充titanic["Age"]=titan...

2019-11-25 23:57:46 438

原创 np.concatenate()函数

import numpy as npa=np.array([[1,2],[3,4]])b=np.array([[5,6],[7,8]])print(np.concatenate(a,axis=0))#对a按行生成一个列表print(np.concatenate((a,b),axis=0))#对a和b,按照行生成一个列表print(np.concatenate((a,b),axis=1))...

2019-11-25 22:27:32 686

原创 ValueError: Input contains NaN, infinity or a value too large for dtype('float64').

#在进行Titanic数据训练时,报错ValueError: Input contains NaN, infinity or a value too large for dtype(‘float64’).问题原因:该问题中,有部分的标签存在空值。解决方法:print(titanic.isnull().any())用该查询后,发现‘Embarked’列存在空值。用titanic[‘Embar...

2019-11-20 00:11:58 276

原创 朴素贝叶斯算法

朴素贝叶斯算法的的目的:寻求一个分类器f(n),使得对任意的Xi,通过分类器能找到唯一的Yi。特征I有{X1,X2,X3…Xn}类别C有{Y1,Y2,Y3…Yn}朴素贝叶斯的核心算法:可以表述成如下形式:例子:如果直接在数据中找,不帅/性格不好/身高矮/不上进,最终嫁人的概率,可能为零。通过分别求解,嫁但不帅,嫁性格不好。。。的概率,可以将问题简化处理。朴素贝叶斯算法的基础是...

2019-11-10 00:46:07 305

原创 机器学习-决策树

西瓜书-第四章 决策树信息熵信息增益信息增益率#西瓜书决策书主要包括内容:信息熵,信息增益,增益率,基尼指数,预剪枝,后剪枝,连续值处理,缺失值处理,多变量决策树。决策树很多内容只是将公式记录上,并没有具体的案例。信息熵 信息增益 增益率关系:信息熵,就是表示样本纯度的参数。信息增益,按照某个属性划分信息,能够得到更好效果的值。信息率,信息增益/属性的“固定值“。(因为信息增益本身缺陷...

2019-10-26 23:14:00 113

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除