sjh752422969
码龄14年
求更新 关注
提问 私信
  • 博客:132,683
    社区:1,889
    134,572
    总访问量
  • 50
    原创
  • 101
    粉丝
  • 24
    关注
IP属地以运营商信息为准,境内显示到省(区、市),境外显示到国家(地区)
IP 属地:江西省
加入CSDN时间: 2011-05-28
博客简介:

sjh752422969的专栏

查看详细资料
个人成就
  • 获得64次点赞
  • 内容获得15次评论
  • 获得158次收藏
  • 代码片获得138次分享
  • 博客总排名1,887,289名
  • 原力等级
    原力等级
    2
    原力分
    156
    本月获得
    0
创作历程
  • 9篇
    2024年
  • 1篇
    2023年
  • 7篇
    2022年
  • 1篇
    2019年
  • 8篇
    2017年
  • 4篇
    2016年
  • 3篇
    2014年
  • 8篇
    2013年
  • 4篇
    2012年
  • 19篇
    2011年
成就勋章
TA的专栏
  • 大模型
    1篇
  • 计算机视觉
    7篇
  • Docker技术
    1篇
  • 软考高级-项目管理
    1篇
  • J2SE进阶
    6篇
  • 工作随笔
    3篇
  • 论文资料
    2篇
  • Android学习
    1篇
  • Pig学习
  • 数据可视化
    3篇
  • D3.js
    3篇
  • hbase学习
    4篇
  • HIVE学习
  • Spark回家吃饭
    6篇
  • 云计算

TA关注的专栏 0

TA关注的收藏夹 0

TA关注的社区 3

TA参与的活动 0

兴趣领域 设置
  • 人工智能
    数据分析
创作活动更多

新星杯·14天创作挑战营·第13期

这是一个以写作博客为目的的创作活动,旨在鼓励大学生博主们挖掘自己的创作潜能,展现自己的写作才华。如果你是一位热爱写作的、想要展现自己创作才华的小伙伴,那么,快来参加吧!我们一起发掘写作的魅力,书写出属于我们的故事。我们诚挚邀请你们参加为期14天的创作挑战赛!注: 1、参赛者可以进入活动群进行交流、互相鼓励与支持(开卷),虚竹哥会分享创作心得和涨粉心得,答疑及活动群请见:https://bbs.csdn.net/topics/619781944 【进活动群,得奖概率会更大,因为有辅导】 2、文章质量分查询:https://www.csdn.net/qc

80人参与 去参加
  • 最近
  • 文章
  • 专栏
  • 代码仓
  • 资源
  • 收藏
  • 关注/订阅/互动
更多
  • 最近

  • 文章

  • 专栏

  • 代码仓

  • 资源

  • 收藏

  • 关注/订阅/互动

  • 社区

  • 帖子

  • 问答

  • 课程

  • 视频

搜索 取消

Chatgpt和GLM api的使用

2.functions:判断用户1和用户2的关系,function,要调用哪个函数,非常有用的功能,可以对文本进行理解,而且可以将文本转为函数的调用。1.embedding模型,gpt和glm不一样。
原创
博文更新于 2024.07.18 ·
300 阅读 ·
3 点赞 ·
0 评论 ·
0 收藏

文本检索与答案检索

语义检索可以做语义相似度的计算,可以处理一词多义,要先做文本嵌入,然后在做相似度计算,可以结合在一起;结合BM2.5和相似度计算;用结巴对输入的问题和内容进行分词,fit可以提取单词的词典大小和IDF的大小。编码完成之后,做归一化,便于后面相似度计算,将相似度转为同一个空间内。有了相似度之后,进行一个排序,就可以通过提问找到比较相似的页面。对分词完的内容提取TFIDF,对提问和每一页的内容进行编码。2.对包含查询内容的文档去进行打分,2.5是打分算法。不仅仅考了的TF和IDF,也考虑 了文本的长度。
原创
博文更新于 2024.07.18 ·
407 阅读 ·
1 点赞 ·
0 评论 ·
0 收藏

数据集读取和评测

pdfplnumber,只针对可复制的版本。
原创
博文更新于 2024.07.18 ·
236 阅读 ·
2 点赞 ·
0 评论 ·
0 收藏

动手学RAG:Part1 什么是RAG?

2、大模型的结构和参数数量导致对其修改、微调和重新训练变得很困难。1、大模型的幻觉问题、时效性问题、数据安全问题。3、基于知识的问答,依赖于信息抽取。
原创
博文更新于 2024.07.17 ·
311 阅读 ·
2 点赞 ·
0 评论 ·
0 收藏

知识的向量表示

9、一对多、多对一如何捕捉?知识逻辑复杂,训练代价和语料不充分?7、onehot很难计算出词的隐藏关系,所以从词嵌入过渡到知识图谱嵌入。4、CBow,通过前面几个词和后面几个词,预测中间几个词。3、词的语义由什么决定?词由他的上下文决定?5、skip-gram,通过中间几个词,预测后面几个词。6、本质都是上下问贡献的来决定词的意义,词的分布式语义。8、知识图谱嵌入模型,TransE\DisMult。2、bag词袋模型,无法表示词的语义。1、one-hot表示,空间太大。10、知识表示是传统AI的核心。
原创
博文更新于 2024.07.08 ·
321 阅读 ·
1 点赞 ·
0 评论 ·
0 收藏

知识图谱的符号表示

7、属性图、RDF\三元组、关系图。3、属性图表示方法的优点和去点。1、基于图的表示建模。5、OWL,本体语言。6、OWL有很多家族。
原创
博文更新于 2024.07.08 ·
254 阅读 ·
1 点赞 ·
0 评论 ·
0 收藏

【百问大模型02】一文讲透RAG实战全解析

11、向量检索:query和知识可以通过相似度向量比较检索,搜索一些top的结果,可以加一下文本规则的限制,提升精准度,得到召回来的知识;对找回来的知识进行排序,把用户的问题,召回来的知识,给他下个模型,输出0和1,0表示不相关,1表示相关强烈,然后对输出的结果进行排序,输出检索的结果;知识图谱,召回一个知识,也把另外一个知识给召回,知识构建、维护成本很高,好用但是慎用;14、对用户的问题,进行优化,比如用大模型来扩展问题HyDE,利用大模型来做假答案,取向量平均值;:推理能力,聪明,知识;
原创
博文更新于 2024.06.24 ·
479 阅读 ·
3 点赞 ·
0 评论 ·
8 收藏

【百问大模型01】GPT4o最新特性介绍

3)调用工具的能力,发布了多模态模型,如阅读理解;不但理解公式、还知道公式是干吗用的;======================PPT素材==================端到端能力300ms;之前是语音转成文字,再来理解分析;4)网页解析的能力,换一个网页转成html文件;今年开始专向小模型发挥极致,尤其显卡不好买的情况下;1) RAG最需要的就是大模型的长文本能力,2)强调了智能体,发力智能体,很不错的;2)理解语音内外的内容。3)发出非语音的声音。4)自然而及时的互动。
原创
博文更新于 2024.06.22 ·
421 阅读 ·
2 点赞 ·
0 评论 ·
1 收藏

从0开始搭建清华ChatGLM3 6b大模型(Windows RTX4090版)

本文基于RTX4090 从0开始搭建清华chatglm3,相当基础
原创
博文更新于 2024.01.03 ·
4647 阅读 ·
14 点赞 ·
1 评论 ·
44 收藏

【AI】Windows配置GPU Cuda驱动和Pytorch框架

在进行AI项目开发的时候,经常要在GPU环境中运行代码,对于没有配置过的新人来说,还是有点复杂的,本文简单总结在Winddows环境种配置的全过程,适合新手入门,仅供大家参考。
原创
博文更新于 2023.01.20 ·
3005 阅读 ·
3 点赞 ·
1 评论 ·
25 收藏

【Docker系列】Docker生产常用命令01

docker常用命令,以备不时之需
原创
博文更新于 2022.09.02 ·
473 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

【AI】反向传播的基本原理(06)

反向传播,也叫误差反传,用误差修正网络中的参数,修正的是权重参数、偏置参数。神经网络就是看你权重和偏置准不准,如果准,预测结果就好些。神经网络的中心任务,就是找到权重、偏置的值,那我们应该怎么找呢
翻译
博文更新于 2022.05.30 ·
2393 阅读 ·
9 点赞 ·
0 评论 ·
16 收藏

【AI】梯度下降的数学原理(05)

函数在某一点出沿着不同的方向运动,函数值的变化率是不同的,梯度可以定义为一个函数的全部偏导数构成的向量。梯度向量的方向是函数值变化率最大的方向。也就是对函数的某个特定点,函数值变化最迅猛的地方。
原创
博文更新于 2022.05.30 ·
1548 阅读 ·
0 点赞 ·
0 评论 ·
9 收藏

【AI】神经网络算法的本质(04)

神经网络的输入数据,都有他自己的特征,如何提取出这些特征,并将它用好这个特征,是我们需要关注的。其实AI最核心的,也是怎么利用这些特征,来求得权重参数。是通过调大、还是调小,调试的结果对结果有什么影响,这个是我们要学习的
原创
博文更新于 2022.05.29 ·
1440 阅读 ·
2 点赞 ·
0 评论 ·
3 收藏

【AI】当传统算法碰到计算机视觉(03)

计算机视觉的任务,其实是个哲学问题:我是谁?而你!又是谁?这是个分类问题。尽管深度学习的内部过程中,提取特征是个黑盒子,但是,我们学习过程中还是要了解里面发生了什么才行,要清楚深度学习做分类任务的原理
原创
博文更新于 2022.05.29 ·
369 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

【AI】人工智能学习之神经网络(02)

神经网络不是算法,而是一种特征提取的方法,现在建模拼的不是算法,而是数据;传统的机器学习(范畴:AI>机器学习>深度学习)的基本步骤如下,这些环节里面最难的是特征工程。
原创
博文更新于 2022.05.29 ·
517 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

【AI】人工智能学习开山唠嗑篇(01)

盘古的天地劈开了,你们人工智能AI的天地也是时候打开了,啥时候打开,就看你啥时候醒
原创
博文更新于 2022.05.29 ·
309 阅读 ·
2 点赞 ·
1 评论 ·
3 收藏

坦克大战Java源代码

发布资源 2011.07.08 ·
application/x-rar

Visual C++与其他开发语言比较的优势

1.与Windows紧密结合。
  MFC类库集成了大量已经预先定义好的类,用户可以根据编程的需要定义相应的类,或根据需要自己定义相应的类。因此Visual C++在使用API等方面和Windows联系的最为紧密
2.强大的类库支持和类改造能力。
  代码重用是C++追求的目标,重用就是从已有的基类派生处新的C++类;MFC提供了大量的基类供程序员们根据不同的应用要求生成新的类以满足要求。VC++有了MFC,具有非常强大对类改造的能力。只要集成MFC类,稍加修改就可以得到符合要
原创
博文更新于 2011.05.28 ·
1302 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

贪吃蛇源代码JAVA

发布资源 2011.07.15 ·
application/x-rar
加载更多