【实测-AI产品(04)】教你创建第一个智能体!

本节课,我们要开始教大家创建一个智能体了~ 

图片

    鉴于目前我参与到的所有产品中,只有腾讯元器是免费给大家开放并且成熟度比较高的。所以咱们就用这个来讲解一下。

    首先打开腾讯元器的官网地址:https://yuanqi.tencent.com/

    然后点左下角登录,手机号登录,然后改个昵称头像。

图片

    这里可以点击“模型额度管理”,看看别人调用了多少token。

图片

    这里可以发现,腾讯赠送了我1亿的token额度,初步估计可以使用几百万次对话吧~ 而且可以看到底层使用的【Hunyuan】,也就是混元大模型。

    然后关掉这个额度对话框,选中左侧菜单-智能体,再点击左上角按钮-创建智能体:

图片

        然后按照要求步骤,填好智能体的名称等信息:

图片

下滑...

图片

图片

插件:插件一般选择的就是这个元器官网上其他用户上传售卖的超专业技术插件了。如果有需要可以添加,也可以自己去创建一些插件卖钱。

图片

知识库:就是专属于你个人的知识储备了,你可以把你的个人笔记、博客、PDF等上传上去。(注意,这里尽量不要盗版,之后国内这些母体资料可能会有查重和检测,也就是你利用别人的公开文章进行训练售卖,属于商业行为,恐怕要出事。不过现在貌似没发现,当然我都是传我自己原创的,毕竟有一千多篇文章和大量私人笔记。而且如果都去使用那些公共的资料,那所有人创作的智能体都几乎一个水平了,那也就没啥特殊的,还怎么获得用户特别的青睐呢?所以还是要带一些自己的压箱底的技术在才能赚钱!)

图片

工作流:一般是处理复杂问题需求的

图片

这里要特别说明一下,目前据我观察,各个大企业的智能体设计并不一致,只有腾讯元器是用插件+知识库+工作流 三项合一的。别的企业的设计五花八门。当然,万变不离其宗。这行业的标准正在制定中。我觉得最舒服最合理的还是元器的。

预览:

图片

    弄好后,点击右上角发布:

图片

    这里我要给大家说一下,虽然完成后也可以进行更改设置,增加知识库等等。

    但不建议在完善之前就发布,一来影响浪费token,二来知识库都是空的导致质量太低可能会有投诉和下架风险哦~

### AI产品的实际测试与评估报告 对于AI产品的实际测试和评估,过程涉及多个方面来确保系统的可靠性、安全性和有效性。这不仅限于技术层面的功能验证,还包括用户体验以及伦理考量。 #### 测试流程概述 AI系统性能的验证和评估通过一系列特定活动完成,这些活动旨在确认AI解决方案能否达到预定目标并符合质量标准[^1]。具体来说: - **设计测试用例**:基于不同场景创建多样化的输入条件,考虑正常操作范围内的典型情况及边界状况下的极端情形。 - **执行测试**:利用上述构建好的案例集对模型进行全面检验;此阶段可能会重复多次迭代优化直至获得满意表现为止。 - **分析结果**:收集来自各个实验的数据点加以审查对比预期行为模式,识别潜在偏差或异常现象以便后续改进措施实施。 #### 编写有效的测试用例 为了提高效率并覆盖尽可能多的可能性空间,编写高质量的测试用例至关重要。应当依据各利益相关者的需求定义清晰的目标函数,并据此确立合理的评价指标体系。同时也要考虑到可能出现的各种意外状况及其影响程度,从而合理分配资源优先处理高风险区域[^2]。 ```python def evaluate_ai_system(input_data, expected_output): """ 对给定数据进行预测并与期望输出比较 参数: input_data (list): 输入特征向量列表 expected_output (list): 预期标签序列 返回: accuracy_score (float): 准确率得分 """ predictions = ai_model.predict(input_data) correct_predictions = sum([pred == true for pred, true in zip(predictions, expected_output)]) total_samples = len(expected_output) return round(correct_predictions / total_samples * 100, 2) ``` #### 形成正式评估报告 最终形成的文档应全面记录整个项目周期中的发现事项,包括但不限于以下几点: - 描述所采用的方法论框架; - 展示关键绩效指数(KPIs)的变化趋势图表; - 提供详细的错误分类统计表单; - 总结改进建议清单以指导未来版本升级方向。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

我去热饭

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值