Projects Overview
Projects Overview
辉少的核心项目索引
Overview
辉少的项目覆盖了深度强化学习、扩散模型、大模型训练优化、多模态生成等多个前沿领域。以下按技术领域分类整理。
深度强化学习
GAIT
- 路径:/home/hui/WorkSpace/Hui-cd.github.io/_posts/2023-10-26-GAIT.md
- 描述:用 DrQ-v2 和 CURL 生成室内美学游览路径
- 核心:视觉 Actor-Critic + 美学奖励函数 + 多样性正则化
- Wiki:[[gait]]
GRPO-Global
- 路径:/home/hui/WorkSpace/GRPO-Global/
- 描述:改进 GRPO 的 Batch-Level 归一化,解决代码修复任务中的信用分配问题
- 核心:SWE-LIM 数据筛选 + 八维复合奖励 + Batch-Level Advantage
- Wiki:[[grpo-global]]
扩散模型与生成
diffusion
- 路径:/home/hui/WorkSpace/diffusion/
- 描述:扩散模型相关实验和实现
flow_matching
- 路径:/home/hui/WorkSpace/flow_matching/
- 描述:Flow Matching 相关研究和实现
- Wiki:[[flow-matching]]
meanflow
- 路径:/home/hui/WorkSpace/meanflow/
- 描述:Mean Flow 相关研究
petgen
- 路径:/home/hui/WorkSpace/petgen/
- 描述:宠物图像生成项目
大模型优化
DeepQuant
- 路径:/home/hui/WorkSpace/DeepQuant/
- 描述:量化相关研究
- Wiki:[[quantization]]
vllm
- 路径:/home/hui/WorkSpace/vllm/
- 描述:vLLM 推理引擎相关
- Wiki:[[pagedattention]]
JiT
- 路径:/home/hui/WorkSpace/JiT/
- 描述:Just-in-Time 编译优化
MobileMoE-1B
- 路径:/home/hui/WorkSpace/MobileMoE-1B/
- 描述:移动端 MoE 模型
minimind
- 路径:/home/hui/WorkSpace/minimind/
- 描述:小型大模型相关
多模态
DeepSeek-V3
- 路径:/home/hui/WorkSpace/DeepSeek-V3/
- 描述:DeepSeek V3 相关研究
- Wiki:[[deepseek]]
实战项目
MCP Agent(车载语音助手)
- 路径:/mnt/c/Users/gyh14/WorkSpace/Personal-Notes/LLM Interview/实战/mcp agent/
- 描述:大小模型协同 + MCP 协议调度
- Wiki:[[mcp-agent-project]]
澳洲电网数据生成
- 路径:/mnt/c/Users/gyh14/WorkSpace/Personal-Notes/LLM Interview/实战/澳洲电网数据生成与修复方案:基于自注意力机制与光谱归一化 GAN 2ec76cf6ec85809a8310f6395950bf01.md
- 描述:基于自注意力 + Spectral Norm GAN 的电网数据修复
Sources
- 项目目录 — /home/hui/WorkSpace/