Skip to content

Projects Overview

辉少的核心项目索引

Overview

辉少的项目覆盖了深度强化学习、扩散模型、大模型训练优化、多模态生成等多个前沿领域。以下按技术领域分类整理。

深度强化学习

GAIT

  • 路径:/home/hui/WorkSpace/Hui-cd.github.io/_posts/2023-10-26-GAIT.md
  • 描述:用 DrQ-v2 和 CURL 生成室内美学游览路径
  • 核心:视觉 Actor-Critic + 美学奖励函数 + 多样性正则化
  • Wiki:[[gait]]

GRPO-Global

  • 路径:/home/hui/WorkSpace/GRPO-Global/
  • 描述:改进 GRPO 的 Batch-Level 归一化,解决代码修复任务中的信用分配问题
  • 核心:SWE-LIM 数据筛选 + 八维复合奖励 + Batch-Level Advantage
  • Wiki:[[grpo-global]]

扩散模型与生成

diffusion

  • 路径:/home/hui/WorkSpace/diffusion/
  • 描述:扩散模型相关实验和实现

flow_matching

  • 路径:/home/hui/WorkSpace/flow_matching/
  • 描述:Flow Matching 相关研究和实现
  • Wiki:[[flow-matching]]

meanflow

  • 路径:/home/hui/WorkSpace/meanflow/
  • 描述:Mean Flow 相关研究

petgen

  • 路径:/home/hui/WorkSpace/petgen/
  • 描述:宠物图像生成项目

大模型优化

DeepQuant

  • 路径:/home/hui/WorkSpace/DeepQuant/
  • 描述:量化相关研究
  • Wiki:[[quantization]]

vllm

  • 路径:/home/hui/WorkSpace/vllm/
  • 描述:vLLM 推理引擎相关
  • Wiki:[[pagedattention]]

JiT

  • 路径:/home/hui/WorkSpace/JiT/
  • 描述:Just-in-Time 编译优化

MobileMoE-1B

  • 路径:/home/hui/WorkSpace/MobileMoE-1B/
  • 描述:移动端 MoE 模型

minimind

  • 路径:/home/hui/WorkSpace/minimind/
  • 描述:小型大模型相关

多模态

DeepSeek-V3

  • 路径:/home/hui/WorkSpace/DeepSeek-V3/
  • 描述:DeepSeek V3 相关研究
  • Wiki:[[deepseek]]

实战项目

MCP Agent(车载语音助手)

  • 路径:/mnt/c/Users/gyh14/WorkSpace/Personal-Notes/LLM Interview/实战/mcp agent/
  • 描述:大小模型协同 + MCP 协议调度
  • Wiki:[[mcp-agent-project]]

澳洲电网数据生成

  • 路径:/mnt/c/Users/gyh14/WorkSpace/Personal-Notes/LLM Interview/实战/澳洲电网数据生成与修复方案:基于自注意力机制与光谱归一化 GAN 2ec76cf6ec85809a8310f6395950bf01.md
  • 描述:基于自注意力 + Spectral Norm GAN 的电网数据修复

Sources