Shiranai

Shiranai

我的羊听我的声音，我也认识他们，他们也跟着我。—— John 10:27

Dynamic Construction of Causal Knowledge Graphs for Scientific Reasoning in Search Agents

作者: F
时间: 15-12-2025
分类: 开发随想
评论

Tongyi DeepResearch 技术报告深度分析

作者: F
时间: 13-12-2025
分类: 论文笔记
评论

一、论文基本信息标题： Tongyi DeepResearch Technical Report作者： Tongyi DeepResearch Team（通义深度研究团队），来自阿里巴巴集团的通义实验室发表平台： arXiv预印本发表日期： 2025年11月5日（最新版本）摘要核心内容：研究目标：开发一个专门用于长时域（long-horizon）、深度信息搜寻研究任务的智能体大语言模型（agentic large language model）核心方法：通过端到端训练框架，结合智能体中期训练（agentic mid-trainin...

閱讀全文...

直接偏好优化（DPO）

作者: F
时间: 08-12-2025
分类: 开发随想
评论

谈 Keir Starmer

作者: F
时间: 07-12-2025
分类: 胡言
评论

我对英格兰没什么意见，甚至某种程度上很喜欢这个国家，虽然也许苏威爱三国更适合人居住。但 Starmer 就是 de facto 自 Theresa May 以后最烂的 PM，这人太痴迷于自己的cakeism了，路线场面左右摇摆，弄得整个社会也一起跟着他的总路线动摇。Starmer又想复兴学校，又想重振NHS，又想发展社会福利，又想带来更大的 House affordability；另一方面Starmer又想研究先端科技，又想保卫边境，又想促进经济，又要防止中国和俄罗斯间谍… 这么多 priorities 到最后就是一个事都没干成，em...

閱讀全文...

从强化学习到近端策略优化（PPO）

作者: F
时间: 06-12-2025
分类: 开发随想
评论