Shiranai

Post-LN Transformer 训练不稳定性的数学分析

作者: F
时间: 05-12-2025
分类: 开发随想
评论

MetaGPT Agent 动态 Action 机制详解

作者: F
时间: 09-11-2025
分类: 开发随想
评论

概述本文档详细记录了如何在 MetaGPT 框架中实现一个具有动态 Action 创建能力的 Agent。通过本教程，你将深入理解 MetaGPT 的 React 机制（run → react → think → act）以及如何在运行时动态切换 Action 序列。作业目标：创建一个 Agent，初始化时拥有三个动作：Print1, Print2, Print3顺序执行这三个动作执行完毕后，动态生成新的动作：Print4, Print5, Print6继续顺序执行新动作学习重点：MetaGPT 的 React 循环机制状态管理（st...

閱讀全文...

坐在工位前加班的时候突然想起去年的一些旅行旧事。

作者: F
时间: 24-08-2025
分类: 胡言
评论

坐在工位前加班的时候突然想起去年的一些旅行旧事。去年的十二月底，搭乘全日空从东京经由札幌飞往北海道最北端的小城稚内。天气很不好，在新千岁航站楼的广播里一直在放送欠航预警。延迟了半小时后最终还是冒着风险起飞了，落地稚内的时候已经是下午五点，外面飘着暴雪。我从来没有见过这么厚的雪。即使是在北极，斯瓦尔巴群岛上的极夜里，让人意识到这是在北国之冬的更多也是来自于无言的冰川而非呼啸着的暴风雪。我拖着行李箱在几十厘米深的积雪中艰难地行走，总算到了前几日提前预定的青旅，里面亮着温暖的灯。“チェックインをお願いします”，我推开青旅厚重的铁门，希望能办...

閱讀全文...

SWE-smith 部署与问题解决技术报告

作者: F
时间: 21-08-2025
分类: 开发随想
评论

概述本文记录了在部署和使用 SWE-smith（一个用于生成软件工程任务的工具）过程中遇到的各种技术问题及其解决方案。SWE-smith 是一个复杂的系统，涉及多个组件：bug生成、验证、收集、issue生成等。遇到的问题与解决方案1. Git推送权限问题问题描述：在执行 python -m swesmith.harness.gather 命令时，遇到以下错误：subprocess.CalledProcessError: Command 'git push origin catchorg__Catch2.9b3f508a.func_p...

閱讀全文...

DeepSeek + HuatuoGPT SFT 调试全记录

作者: F
时间: 10-08-2025
分类: 开发随想
评论

本文详细记录了针对 DeepSeek-Coder-7B-base-v1.5 模型，结合 HuatuoGPT 医疗对话数据进行 SFT（Supervised Fine-Tuning）的全过程。记录从最初设计到逐步调试的每一步，包括所做的改动、背后的原因、遇到的问题、解决方案以及最终结果。1. 项目背景与目标本次任务的目标是：首先加载基模型，在这个项目中基模型为 DeepSeek-Coder-7B-base-v1.5 。加载已有的 LoRA checkpoint（checkpoint-2000），在此基础上继续微调。使用 Freedom...

閱讀全文...

Post-LN Transformer 训练不稳定性的数学分析

MetaGPT Agent 动态 Action 机制详解

坐在工位前加班的时候突然想起去年的一些旅行旧事。

SWE-smith 部署与问题解决技术报告

DeepSeek + HuatuoGPT SFT 调试全记录

最新文章

最近回复

分类

归档

其它