AI学习笔记-实践项目开发记录

《半数黑金(Half_Black_Money)》项目开发记录

github链接 open-hbm

项目背景

项目专注于技术验证与原型开发,实践了多种技术架构方案,构建了核心功能的技术原型,并形成了可复用的技术组件。初期选择了FastAPI作为后端服务框架,Ollama作为本地AI模型推理引擎,LangChain用于增强对话系统能力。此外,还参考了多个开源项目和技术文档,确保项目的先进性和实用性。

通过不断迭代更新,《半数黑金》旨在为玩家提供一个既充满挑战又富有创意的游戏体验,同时也是一个让玩家能够发挥想象力、共同编织故事的理想平台。

项目目标

本项目专注于技术验证与原型开发:

  • 实践多种技术架构方案
  • 构建核心功能的技术原型
  • 形成可复用的技术组件

半数黑金卡牌游戏阶段

第一版 202412

以单一html页面实现基础游戏逻辑,并通过本地AI模型推理引擎实现对话系统。并实现了通过cpolar调用远程ollama服务,但未实现调用远程comfyui工作流生图

第二版 202502

基于flask框架实现,前端面向手机优化

第三版 202503

基于fastapi框架实现,前端面向web(浏览器)优化

第四版 20250407

基于社区(论坛)形式的对话进行故事生成

历史项目设想

一个完全不同的方向,机器视觉 202406-07

还在基础学习阶段的时候想去做针对注塑制品的质检,基于opencv这类的算法去做分类,标注缺陷区域,注塑件的难点是一般不是平面的,而且产线变化很快,一个模具打几个月的有,一天换几个模具的也有,一般也就是几天到一周,但是当时成熟的方案都是针对太阳能板或钢材生产这类的平面的且产线变化极慢的,在产线上可能只能提供几张最多几十张做短期训练就要使用,在学习一定基础进一步了解现状后就放弃了.软硬件结合的项目对于个人甚至小团队来讲都具有更高的挑战.
在此时期还去参加了一次展会,当时最潮的也就AI物体识别抓取配件的演示,智能客服,数字人,也有机器狗,人形机器人,还看到了阿里基于攀升做的服务器

礼物推荐 202407

简单AGENT 百度千帆
根据多轮对话,引导用户提供必要信息,最终推荐商品
难点1 商品信息获取,虽然通过工具检索了如淘宝等平台的商品信息,但是这相当于被平台推荐算法左右了
难点2 保持用户耐心,以便用户提供足够的信息
难点3 怎么做的比推荐算法好
回想,百度平台推流相当于0,商业价值也为0,后来百度推出了收费的智能体和AI模式定制市场

虚拟交友 202408

AGENT,工作流 百度
知识库+记忆,连续对话,情感模拟,然后积累足够信息后匹配推荐真人
难点1 知识库的构建,没有基础数据,没有基础用户,数据飞轮完全是空想,这种需要模型微调的项目无法推进
难点2 记忆的构建
回想,现在看基座模型的迭代其实满足了情感模拟的问题,但是还是要雕琢,另外硅基智能的数字人好用,而且还得加语言转换(主要是情感)
选择如果还在dify或者langchain可能能做个demo

AIGC comfyui 202409 - 11

有段时间沉迷出图,就出图…
试了视频生成,civitai找的基础工作流,跑出来不行,手指这些四肢必然出问题,可灵还是有希望的
模型相当于训练炼丹,出图相当于抽卡,因为这个才考虑的卡牌游戏,另外
打标尝试lora训练
感觉flux.1 出图挺好的了,不过要实现强一致性还有长视觉视频生成都还需要时间积累

在一个提示词转换,sd系列是关键字提示词,flux.1提示词支持长文本,但是这些都只支持英文提示词,hunyuandit出图效果又太渣

生日报纸

先通过搜索准备出生日的一些新闻文本,在生成一到二张配图,在整合到一个类似报纸的版面中

儿童读物

漫画风的出图,一图出4格漫画然后控制一致性生成儿童读物的项目也考虑过
TencentARC/SEED-Story: SEED-Story: Multimodal Long Story Generation with Large Language Model
ReadKidz
为什么?这是内容市场,不论是做模型还是做内容都可以,而且市场很大,家长的分辨能力有限,不用做太高画质.还能给我儿子看…
这东西需求量还大,小孩看一本书可能随便翻翻就过去了,当然也有的几本书会吸引小孩反复看,一套书里有这么一本两本,一套书10几本就都卖出去了,而且家长几乎必然会买大量的书

通过蛙蛙写作去写小说 202411

准备了几本觉得好的小说,通过embedding模型训练,然后生成
导入小说到知识库里,生成的时候增强
相当于可以模拟喜欢的写作风格
回想,写短篇挺带劲的,长了一致性不好控制,现在如果有开源项目实现最近openai吹的无限记忆,应该可以进一步尝试下

创业心路

什么时候关注AI

2022年的时候还感觉不到AI变革的冲击,2023年chatgpt就已经是聊天时经常提到的词了,那时候在廊坊银行做外包,就和同事说得尝试一次去做一个自己的项目,但没有想要做

什么时候开始的全职的

当时在天津银行数仓项目做外包,才换工作不久,模型大规模调价,开源模型不断逼近闭源模型,是我说服自己可以开始用AI真的做什么的

路径的具体选择

当时关注了 AGI Playground Founder Show 202407,看了几个项目的路演演讲,让我对AI创业的路径的选择很深
套壳

对AI的安全问题

没想到,我轻松干预了 DeepSeek 的搜索结果

AI对话核心

上下文向量化,检索增强生成,多候选生成,排序选择

  1. 用户输入预处理(NLP管道)
  2. 上下文检索(RAG + VectorDB)
  3. 生成候选回复(LLM + Beam Search)
  4. 排序和选择(Top-p采样)

核心技术

  • FastAPI - 高性能后端服务框架
  • Ollama - 本地AI模型推理引擎,调用时可以添加很多如温度,top一类的参数
  • LangChain - 增强对话系统能力,减少了需要部署的服务,在代码中就可以直接集成工具化和工作流化的调用模型

备选方案

  • Dify - AI模型可视化部署,低代码的实现,在实现简单工作流时远比langchain更加简单
  • Ren’Py - 叙事内容展示引擎
  • web3.py - 太坊区块链交易
  • pygame - 专门为开发 2D 游戏而设计的 Python 第三方库,它基于 SDL(Simple DirectMedia Layer)库构建,提供了一系列用于创建游戏所需的功能模块,如处理图形、声音、输入等,让开发者能够使用 Python 语言快速且便捷地开发出跨平台的 2D 游戏

建站工具

冷启动和推流

web框架参考

类似项目

Renpy开发框架


AI学习笔记汇总

专题笔记

1. 机器视觉

2. 文生图与AIGC

3. 文生文

4. 开发环境

5. 开源项目信息

6. 实践项目开发

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

梦魇泪

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值