External Blogs

权威 AI 研究者的博客和网站索引

Overview

除了辉少自己的笔记，以下外部博客是 AI 领域的重要知识来源。这些博客由顶尖研究者和从业者维护，涵盖了大语言模型、扩散模型、强化学习等前沿方向。

URL: https://lilianweng.github.io/

背景: OpenAI 前安全系统负责人，现 Anthropic。博客以深度技术解析著称。

核心文章:

“LLM Powered Autonomous Agents” (2023) — Agent 架构基石文章
- 涵盖 Planning、Memory、Tool use
- ReAct、Reflexion、Chain-of-Thought
- Multi-agent 系统
“Reward Hacking in Reinforcement Learning” (2024-11) — Agent 安全与对齐
- Specification gaming 和 reward hacking
- 对 LLM agent 对齐的高度相关

特点: posting 频率 2024 年后降低（转职原因），但每篇都是精品。

URL: https://kexue.fm/

背景: 中文世界最深入的 Transformer/注意力机制分析者之一。

核心贡献:

RoPE (Rotary Position Embedding) — 旋转位置编码
- 被 LLaMA、PaLM 等大模型广泛采用
- 公式: $f(q, m) = q e^{i m \theta}$
GAU (Gated Attention Unit) — 融合注意力与 FFN
Transformer 升级之路系列 — 系统性改进研究

核心洞察:

“注意力机制的核心不是’关注哪里’，而是通过内积实现相似度度量后的加权平均。” “Transformer 的成功在于并行计算 + 全局交互 + 可扩展性的三位一体。”

URL: https://yang-song.net/blog/

背景: Score Matching 和扩散模型统一框架的提出者（Score SDE）。

核心工作:

Score-Based Generative Modeling through SDEs (ICLR 2021)
- 统一了 Denoising Score Matching、Langevin dynamics、DDPM
- 核心洞察：Diffusion models = Score matching + SDEs
Denoising Diffusion Implicit Models (DDIM) — 快速采样
Noise Conditional Score Networks (NCSN) 系列

URL: https://ysymyth.github.io/

背景: 强化学习与大模型结合的研究者。

关注方向:

阅读优先级:

与辉少笔记的关系: