数据分析(机器学习)
无
董厂长
I'm looking for opportunities. If you are interested, please send me a message.
展开
-
医学知识和医疗应用开发交叉领域中垂类大语言模型应用相关研究
随着LLM(大语言模型)的爆火,不少企业都在寻找通过LLM解决企业业务问题的方法,以达到降本增效的效果。但是,当面对较为复杂的业务问题(如:背景资料多、问题分类多、条件判断复杂、涉及模块多等)时,以LLM当前的发展程度,仅通过简单的LLM对话交互,是无法有效地解决此类问题的,原因在于,LLM也有自身的能力限制,如幻觉、上下文等。2.3. AI透明度问题:使用ChatGPT生成内容可能会造成读者或用户对AI来源或质量的不了解或误解,需要提供清晰的标识或说明,并保证内容的可解释性、可信度和可控性。原创 2024-02-28 23:09:04 · 1009 阅读 · 4 评论 -
COMP527数据分析:中心性度量
在数据分析中,中心性度量通常是指描述数据集中心位置的统计量。原创 2023-07-15 21:59:27 · 345 阅读 · 0 评论 -
网页排名算法 page rank algorithm
关于recall 这个东西的原因,纯粹是想着以后答辩时候,关于工作量统计或者统计模块重要性可以拿出来算一下。原创 2023-03-28 00:25:03 · 356 阅读 · 0 评论 -
感知器算法的笔记,写单个神经元
关于感知器算法的笔记,或者换个说法 二元分类器原创 2023-03-28 00:15:03 · 106 阅读 · 0 评论 -
L2 norm的理解
问题:normalise each object (vector) to unit l2 length before clustering解决:L2范数归一化就是向量中每个元素除以向量的L2范数原创 2021-04-26 09:22:31 · 638 阅读 · 0 评论 -
Perceptron algorithm正则化踩坑记录
今天又是一个好日子,鏖战半夜三四点,在对感知机算法Perceptron algorithm进行正则化时候遇到一些小坑。首先Percepton对L2正则化中,学习率=1最后是可以不计入的,那么对“λ”来说,不是设置一个float就行。“λ”的维度必须和W权重维度一样。1.第一个坑:TypeError: unsupported operand type(s) for -: 'list' and 'list'reg=[0.001 for _ in range(n_feature)] s原创 2021-03-14 11:36:11 · 1593 阅读 · 2 评论 -
关于如何分割data类型文件的小技巧
最近在学习数据处理,需要手撸一个感知器算法二分类模型。那么第一步就是数据格式的处理。众所周知,老师只管甩数据,处理问题还是要自己来。首先看看数据格式为 .data 格式。好家伙,经典花儿分类掐头去尾就扔过来了。感知器算法传入的参数一个是数据集matrix一个是标签label。看文件就知道需要考察我们对数据分割处理的能力。直接使用numpy自带的 .loadtxt()功能,usecols是指定读取哪一行(从0开始),skiprows指定多少行不读取。如果文件的数据不是空格隔开的,而是用其他符号原创 2021-03-01 07:58:23 · 1422 阅读 · 0 评论