Skip to content
衍微的知识库
模型系列
Initializing search
衍微的知识库
首页
机器学习基础
机器学习基础
Machine Learning Basics
Logistic Regression
KL Divergence
Gaussian Distribution
Spherical Gaussian
Gaussian Posterior
Poisson Distribution
Probability Basics
EM Algorithm
Orthogonal Basis
深度学习
深度学习
Transformer
Flash Attention
Infini-Attention
Activation Functions
U-Net
GEMM
Floating Point Formats
大模型训练
大模型训练
LLM RL Algorithms
SFT vs RLHF
DeepSpeed
Quantization
生成模型
生成模型
Diffusion Model
Flow Matching
VAE
ResShift
推理优化
推理优化
PagedAttention
模型系列
模型系列
DeepSeek
Qwen Series
辉少项目
辉少项目
GAIT
GRPO-Global
MCP Agent Project
Projects Overview
面试题
面试题
LLM Questions 2025
Interview Notes Comprehensive
外部资源
外部资源
External Blogs
日志
Table of contents
概述
文章列表
相关主题
模型系列
概述
主流开源大模型系列的技术演进。
文章列表
deepseek
— DeepSeek 系列核心技术
qwen-series
— 通义千问系列演进
相关主题
深度学习
大模型训练