AI驱动的科研-科研自动化
文章平均质量分 85
AI驱动的科研
AI生成曾小健
"AI生成曾小健2"是该号副号。AI生成式技术,计算机博士;llama3、Baichuan2、Qwen、GLM-4等等项目贡献人(ArtificialZeng)。这个博客的主题主要是AI生成式技术、AI相关技术、机器/深度学习论文或科研前沿、GNN图神经网络、神经网络,包括人工神经网络和生物神经网络,及其大脑演化,智能和认知的产生,通用人工智能;
如果需要看商科/金融相关的请移步CSDN: 量化交易曾小健(金融号)
展开
-
experiment.py. scientist
定义一个名为 CausalSelfAttention 的类,继承自 nn.Module,用于实现因果自注意力机制。定义一个名为 Block 的类,继承自 nn.Module,用于实现 Transformer 的基本块。定义一个名为 LayerNorm 的类,继承自 nn.Module,用于实现层归一化。定义一个名为 GPT 的类,继承自 nn.Module,用于实现 GPT 模型。以上是对代码文件的逐行解释。否则设置为 None。定义一个名为 MLP 的类,继承自 nn.Module,用于实现多层感知机。原创 2024-09-13 10:51:20 · 580 阅读 · 0 评论 -
AI科研 scientist
Projects/AI-Scientist$ python launch_scientist.py --model "deepseek-coder-v2-0724" --experiment nanoGPT_lite --num-ideas 2Using GPUs: [0, 1, 2, 3, 4, 5, 6, 7]Using OpenAI API with deepseek-coder-v2-0724.Generating idea 1/2Iteration 1/3{'Name': 'dynamic原创 2024-09-12 23:05:16 · 373 阅读 · 0 评论 -
人工智能科学家:迈向全自动开放式科学发现AI Scientist Sakana AI
这里和下面,我们给出了设置每个模板的数据和基线评估的说明。这必须在您的机器上运行,因为训练时间可能因您的硬件而异。(通常,我们会在文件本身中执行此操作,但由于它是可见的,因此不清楚这会如何影响 AI Scientist)。,这是第一个用于全自动科学发现的综合系统,它使大型语言模型 (LLM) 等基础模型能够独立进行研究。提供了我们论文中的所有运行和数据,其中我们在每个模板上运行每个基本模型以获得约 50 个想法。),我们的代码还可以选择使用它来提高吞吐量,但原则上如果没有它它也应该能工作。原创 2024-09-12 21:33:38 · 711 阅读 · 0 评论 -
launch_scientist.py 源码
从 ai_scientist.perform_review 模块导入 perform_review、load_paper 和 perform_improvement 函数,用于审查论文和改进。添加 --model 参数,指定要使用的模型,提供多个选项,默认为 "claude-3-5-sonnet-20240620"。添加 --experiment 参数,指定要运行的实验类型,默认为 "nanoGPT"。以上是对代码文件的逐行解释。添加 --writeup 参数,指定撰写的格式,默认为 "latex"。原创 2024-09-12 23:21:31 · 454 阅读 · 0 评论