Skip to content

Wiki Index

Last updated: 2026-04-29 — 32 pages

Concepts

Page Summary Updated
[[machine-learning-basics]] 贝叶斯分类、Fisher LDA、感知器、SVM 2026-04-25
[[logistic-regression]] Sigmoid 概率分类,交叉熵损失,无闭式解 2026-04-29
[[gaussian-distribution]] 最大熵/CLT/微分方程三角度推导 2026-04-29
[[spherical-gaussian]] 协方差 \(\sigma^2 I\) 的简化多元高斯 2026-04-29
[[gaussian-posterior]] 高斯先验+线性高斯似然的后验解析解 2026-04-29
[[poisson-distribution]] 二项分布极限,稀有事件计数 2026-04-29
[[probability-basics]] 先验/后验/贝叶斯定理与基础比率谬误 2026-04-29
[[em-algorithm]] E步+M步迭代,隐变量模型参数估计 2026-04-29
[[orthogonal-basis]] 正交基、标准正交基、Gram-Schmidt 过程 2026-04-29
[[activation-functions]] Sigmoid 到 GELU 的演进与选择策略 2026-04-29
[[flash-attention]] GPU 注意力 IO 优化,分块 + online softmax 2026-04-25
[[infini-attention]] 无限长序列注意力,压缩记忆 2026-04-25
[[transformer]] 自注意力序列建模架构 2026-04-25
[[unet]] 编码器-解码器架构与下采样替代方案 2026-04-29
[[diffusion-model]] DDPM、Score Matching、SDE 统一视角 2026-04-25
[[flow-matching]] 速度场回归生成模型 2026-04-25
[[vae]] 变分自编码器与潜变量生成 2026-04-25
[[resshift]] 基于残差移位的扩散超分辨率 2026-04-29
[[kl-divergence]] 正态分布 KL 散度推导 2026-04-25
[[llm-rl-algorithms]] PPO、DPO、GRPO 对比 2026-04-25
[[deepseek]] DeepSeek 系列核心技术 2026-04-25
[[grpo-global]] 辉少的 GRPO-Global 项目 2026-04-25
[[sft-vs-rlhf]] 为什么有 SFT 还需要 RLHF 2026-04-25
[[deepspeed]] ZeRO 三阶段显存优化 2026-04-25
[[pagedattention]] vLLM 的显存分页管理 2026-04-25
[[quantization]] AWQ、GPTQ、QLoRA 量化方法 2026-04-25
[[floating-point]] FP16/BF16 低精度浮点格式权衡 2026-04-29
[[gemm]] 通用矩阵乘法与深度学习计算优化 2026-04-29
[[qwen-series]] 通义千问系列演进 2026-04-25
[[mcp-agent-project]] 车载语音助手项目 2026-04-25
[[interview-notes-comprehensive]] LLM 面试笔记综合索引 2026-04-25
[[projects-overview]] 辉少核心项目索引 2026-04-25
[[external-blogs]] 权威 AI 研究者博客索引 2026-04-25
[[llm-questions-2025]] 2025 年大模型面试题汇总 2026-04-25
[[gait]] 深度 RL 生成室内美学路径 2026-04-25

Sources processed

Page Summary Updated
Blog posts (Hui-cd.github.io) 27 篇技术博客 2026-04-29
LLM Interview Notes Day1-Day14 面试笔记 2026-04-25
Personal Notes 概率基础、浮点格式、GEMM 等 2026-04-29