ningyuanfeng-CSDN博客

原创【大模型和智能问答系统】

大模型如何在智能对话领域应用，大模型能完全取代传统智能对话吗？

2023-09-29 00:50:36 3398

原创 triton部署 python backend 输入字符串

背景：最近在做智能对话项目，用triton进行模型的部署和管理。triton 除了部署模型外，还支持.py文件的推理。根据项目需求，需要将自定的python代码，作为模型部署到triton中，且模型的输入是文字。输出的结果是分词结果。准备：1.triton 21.12镜像2.容器中安装 LAC库。百度分词库。pip install lac -i https://mirror.baidu.com/pypi/simple操作：1、在模型仓库下，创建如图所示的目录结构；lac – 模型名称，在

2022-05-25 14:25:19 4897 2

原创 gradient_accumulation_steps --梯度累加理解

参考：https://blog.csdn.net/Princeicon/article/details/108058822https://blog.csdn.net/weixin_43643246/article/details/107785089假设情景：batch_size = 10 #每批次大小total_num = 1000 #数据总量按照训练一个批次数据，更新一次梯度；训练步数 train_steps = 1000 / 10 = 100梯度更新步数 = 1000 / 10 = 1

2021-12-23 16:50:25 9321 3

原创动态本体 palantir

102解析器与106本体耦合，106本体与108数据库耦合；106本体有一个或多个110对象类型和116属性类型110对象类型实例化多个112对象每一个对象有一个或多个属性116属性类型实例化114A和114B属性116属性类型有一个或多个118组件，组件有字符串、数字等120基本类型（location）实例化116属性类型（home）124 对象类型编辑器创建110对象类型126属性类型编辑器创建116属性类型在126属性类型编辑器创建116属性类型时，至少要用到一个122解析器编辑器.

2020-12-23 20:48:12 2906 2

原创 java正则化，返回同一字符串多处匹配结果。

1、需求：正则化匹配时，正则表达式pattern，需要匹配字符传string中的多处，并将没一处的位置信息返回！2、代码：import java.util.ArrayList;import java.util.HashMap;import java.util.regex.Matcher;import java.util.regex.Pattern;public class test { public static void main(String[] args) {

2020-10-20 19:43:10 1516

原创 from bert import modeling,报错“module ‘bert‘ has no attribute ‘modeling‘”

背景：tensorflow版本：2.21查询方法：import tensorflow as tf tf.__version__bert安装方式：pip install bert问题+解决方法问题1.tensorflow的版本不匹配；解决：将tensorflow的版本降低为1.15.0：install tensorflow==1.15.0 -ihttp://pypi.douban.com/simple --trusted-host pypi.douban.com解释：更新tensor

2020-08-26 16:39:22 3429 2

原创 python的广播机制（broadcasting)

1.python的广播机制什么？原理：两个数组的后缘维度相同，或者在其中一方的维度为1。广播在缺失或者长度为1的维度上补充。2.python的广播机制是做什么用的？对缺失维度进行补充，可以减小代码量；3.举例阐述一下python的广播机制。后缘维度：A为（3，4，5）的三维数据，B为（4，5）的二维数组。由于A和B的后缘维度都为（4，5），所以可以进行广播机制。同理:A为（3，4）的二维数组，B为（4，）的1为数组，他们的后缘维度都是4,所以可以进行广播。其中一方维度为1：A为（4，5）的三维

2020-08-07 23:00:02 10699 2

原创 pd.read_csv()时，报错：‘utf-8‘ codec can‘t decode byte 0xa5 in position 1124: invalid start byte

1,打开csv文件时，总是报错：后面加：encoding=“utf-8”也有其他位置报错。train=pd.read_csv("C:/AI/数据/pair question/quora-question-pairs/train/train.csv",encoding="utf-8")问题：csv文件的编码格式与python读入文件的指定的encoding参数不一致，encoding参数默认为 utf-8。解决方案：将csv文件重新编码保存将.csv文件保存一下，然后鼠标右击打开方式记事本。然后，

2020-07-19 00:47:59 1305

原创 win10设置Python程序定时运行任务（列一下自己遇到的问题）

在win10上，做python定时执行任务。第一步：打开控制面板；（按win键后，输入“控制面板”）第二步：控制面板右上角，“查看方式”选择“大图标”；第三步：选择“管理工具”；第四步：选择“计划任务程序”；第五步：右键”任务计划程序库“，选择”创建基本任务“；下面为创建自动化脚本步骤，参考博客：第六步：创建基本任务触发器解释下三个参数：【程序或脚本】文本框中填的是Python编译器的名称，一般就是python.exe，【起始于】文本框中填的是Python编译器的目录，上图中假设

2020-07-13 11:31:41 1634 1

原创 mysql在数据库中创建工作表时，总是报语法错误。（表名字符号有问题）

表名字和字段外面的符号不是引号！！！！是键盘上面，tab键上面的反引号！！！··········································，就是这玩意。反引号是为了区分 MySql 关键字与普通字符而引入的符号，一般的，表名与字段名都使用反引号。...

2020-05-12 10:43:50 2397 1

原创本地下载mysql 8，使用navicat登陆时，报错：1045 - acess denied for user "root"@"localhost"

PS:按照加粗字体操作，即可解决，其他内容记录下遇到的坑。1.根据介绍，该问题是由于root用户没有赋权导致。进行赋权操作：首先登陆服务器：在cmd命令行（管理员身份），输入命令：mysql -uroot -p ；输入密码进入mysql。网上大部分介绍使用命令：grant all privileges on . to root@‘localhost’ identified by “123456”;赋权操作。输入完命令后，遇到报错：1064 - You have an error in you

2020-05-09 01:38:30 544

原创 anaconda下安装tensorflow过慢，导致安装失败

问题：电脑重新安装tensorflow，由于国内清华等一些镜像网站已经不能访问，必须在默认的下载地址进行下载，速度很慢，经常断掉下载不下来。解决：要安装tensorflow，首先要建立一个python3的虚拟环境，按照开始的建立方法，下载太慢，一直没有下载下来。参照了这篇文章：https://blog.csdn.net/qq_44639795/article/details/1006931...

2020-03-26 10:50:42 7790 6

原创 pandas读取数据时，报错UnicodeDecodeError: 'utf-8' codec can't decode byte 0xce in position 0: invalid contin

1.我的代码：df_train=pd.read_csv("C:\\Users\\15520\\Desktop\\AI\\阿里天池\\幸福感挖掘\\happiness_train_complete.csv")但读取同样位置的另一个文件，就没有这种错误：abbr_train_data=pd.read_csv("C:\\Users\\15520\\Desktop\\AI\\阿里天池\\幸福感挖掘...

2020-02-27 10:51:33 1469

原创 xgboost库在anaconda下的安装

环境：win10 64位+python 3.7xgboost包下载地址：https://www.lfd.uci.edu/~gohlke/pythonlibs/#xgboost我下载到自己电脑地址：C:\Users\15520\Desktop\AI\anaconda\xgboost下载完成后，打开anaconda操作界面:切换到对应目录：cd C:\Users\15520\Deskto...

2020-02-25 09:17:32 447

原创 excel中单元格中的null，在pandas导入到程序中，全部识别为nan，空值。

在做阿里天池的o2o消费者用券行为预测时，对于数据中的没有数据的值，其全部用“null"表示了。将该数据导入到程序中，其全部显示为Nan。该位置的数据类型，用isnull函数判断，为空值。...

2020-01-10 22:09:17 1317 1

原创机器学习-逻辑回归

#原理逻辑回归是分类问题。对x的输入特征进行学习，输出y值属于哪一类的分类算法。比如：在titanic机器学习中，给出乘客的姓名/年龄/性别等一系列的值（X的值），通过对一些列值的学习，得出最终乘客是幸存还是死亡(最终的y值是0还是1，0代表死亡，1代表幸存）。首先，y=wx+b,这是最基本的线性公式。即x和y呈现线性对应关系。.但是，在很多实际问题处理时，输入变量x和输出变量y之间，是...

2019-12-17 21:43:23 412

原创 ValueError: Input contains NaN, infinity or a value too large for dtype('float32').

问题：在机器学习做titanic时，报错ValueError: Input contains NaN, infinity or a value too large for dtype(‘float32’).原因：因为在输入数据时，有的列中的数据为空，导致报错。用np.isnan(titanic[x]).any() 检查相应的列是否为空，如果有为空的值就返回True，否则返回false。p...

2019-11-30 23:49:22 1851

原创 kaggle-Titanic训练-线性回归法算法

处理数据：import pandas as pdtitanic=pd.read_csv("C:/Users/15520/Desktop/AI/kaggle/titanic/train.csv")# titanic.describe()#descrbie()函数只描述含有数据的列，对"sex"这样的列没有描述#"age"列的数据有缺失，用平局值填充titanic["Age"]=titan...

2019-11-25 23:57:46 573

原创 np.concatenate()函数

import numpy as npa=np.array([[1,2],[3,4]])b=np.array([[5,6],[7,8]])print(np.concatenate(a,axis=0))#对a按行生成一个列表print(np.concatenate((a,b),axis=0))#对a和b，按照行生成一个列表print(np.concatenate((a,b),axis=1))...

2019-11-25 22:27:32 755

原创 ValueError: Input contains NaN, infinity or a value too large for dtype('float64').

#在进行Titanic数据训练时，报错ValueError: Input contains NaN, infinity or a value too large for dtype(‘float64’).问题原因：该问题中，有部分的标签存在空值。解决方法：print(titanic.isnull().any())用该查询后，发现‘Embarked’列存在空值。用titanic[‘Embar...

2019-11-20 00:11:58 388

原创朴素贝叶斯算法

朴素贝叶斯算法的的目的：寻求一个分类器f(n),使得对任意的Xi，通过分类器能找到唯一的Yi。特征I有{X1,X2,X3…Xn}类别C有{Y1,Y2,Y3…Yn}朴素贝叶斯的核心算法：可以表述成如下形式:例子：如果直接在数据中找，不帅/性格不好/身高矮/不上进，最终嫁人的概率，可能为零。通过分别求解，嫁但不帅，嫁性格不好。。。的概率，可以将问题简化处理。朴素贝叶斯算法的基础是...

2019-11-10 00:46:07 359

原创机器学习-决策树

西瓜书-第四章决策树信息熵信息增益信息增益率#西瓜书决策书主要包括内容：信息熵，信息增益，增益率，基尼指数，预剪枝，后剪枝，连续值处理，缺失值处理，多变量决策树。决策树很多内容只是将公式记录上，并没有具体的案例。信息熵信息增益增益率关系：信息熵，就是表示样本纯度的参数。信息增益，按照某个属性划分信息，能够得到更好效果的值。信息率，信息增益/属性的“固定值“。（因为信息增益本身缺陷...

2019-10-26 23:14:00 191

weixin_44319196的博客