祝培竣.ai OPEN TO WORK '27

AI AGENT ENGINEER ✦ RESEARCHER — BASED IN GUANGZHOU

祝培竣 PEIJUN ZHU

构建会思考、会协作、会自我进化的智能体系统。
从模型微调到多智能体落地 — Multi-Agent / MoE / RAG / 3DGS。

NOW — 贪玩 · AI效率部 · Agent研发
广州大学人工智能 BSc '27
SCI Q1 ×1 · NeurIPS 在投 ×2

↓ 向下探索

01

关于 — 宣言

MANIFESTO

我相信下一代软件不是被使用的工具，而是会协作的同事——我在大模型与多智能体的交叉地带工作，让 Agent 学会拆解任务、调用工具、彼此协商，并在真实业务里交付可量化的结果。

“I build systems that think in swarms — fluid, self-evolving, accountable.”

0 3 段大厂 Agent 研发实习
联通 · 软通动力 · 贪玩

0⁺ 学术论文 & 知识产权
SCI Q1 · EI · 发明专利 ×4 · 软著 ×12

0 论文被引
Google Scholar Citations

0⁺ 博客获赞与收藏
技术分享 · 社区贡献

0 GitHub Contributions
过去 12 个月 · 2026-07 更新

0^★ 个人开源项目获得
BREAKING THE MOE TRILEMMA

02

经历 — 时间线

DRAG THROUGH TIME →

01 2024.09 — 2025.03

中国联通技术部

AI AGENT 工程师

元景大模型 × 高速泛安防 — 纯视觉车辆检测 / 违章识别 / 路况监测，推理链路优化后端到端延迟 <50ms，联合判准率 99.17%，支撑全省高速智能监控。
HIMO-CLIP 跨模态对齐框架 — HiDe 层次化解构 + MoLo 单调性损失，不改编码器建模语义层级，跨模态检索精度 +25%。

#CV#CLIP#大模型二次开发

02 2025.03 — 2025.09

软通动力DEIC 智算中心

AGENT 研发工程师

众联多式联运物流 Agent中标项目 — GPS/订单/路况多源融合的自动化调度与车货匹配，订单达成率 +27%，支撑日均万级订单。
AI4S 科研辅助系统 — 文献检索→数据处理→模型训练→结果分析全链 Agent，人在回路综合提效 40%。
美洲大豆量化预测 Agent中标项目 — 气象/期货/种植多源时序建模与因子挖掘，输出跨境贸易策略。

#Multi-Agent#AI4S#时序量化

03 2025.09 — NOW

贪玩游戏AI 效率部

AI 研发工程师（AI AGENT）

TW Agent 智能体引擎 — 基于 OpenClaw 的企业级多智能体协同：任务拆解 / 工具调用 / 流程编排全自动，隔离容器 + 权限审计，飞书工作台深度联动，团队提效 42%。
TW Deliver 买量投放引擎 — 27 维标签理解与策略自动生成，CTR / ROI / 首日付费预测 74% / 68% / 64%，计划投放成本 −3.27%。

#Agent引擎#投放智能#权限与审计

NEXT
= YOU? 下一段旅程，与你的团队 →

03

精选项目

SELECTED WORKS 2024—26

001 DEGUC — MoE 动态专家分组与联合压缩流式聚类聚合专家 · 共享基底 + 低秩残差 · 中科院庙算平台部署，泛化性 +20% RESEARCH · NeurIPS 在投（一作）
002 Breaking the MoE Trilemma 打破 MoE「容量—负载—通信」不可能三角的开源探索 OPEN SOURCE · 21★
003 先知 — 中科院兵推大模型 Breaking the MoE Trilemma 论文工程化变现 · 比原有 SOTA bench 评分强 20% INDUSTRY · 中科院庙算平台
004 GenericAgent — 自进化智能体 3.3K 行种子生长技能树 · 全系统控制 · Token 消耗降至 1/6 CONTRIBUTOR · SELF-EVOLVING
005 OpenSquilla — Token-Efficient Agent 同等预算，更高智能密度的 Agent 运行时 CONTRIBUTOR
006 cc-switch — Agent CLI 总控台 Claude Code / Codex / OpenClaw / Gemini CLI 等多智能体桌面切换器 CONTRIBUTOR · CROSS-PLATFORM
007 TW Agent — 智能体引擎基于 OpenClaw 的企业级多智能体协同 · 任务拆解 / 工具调用 / 流程编排 · 团队提效 42% ENTERPRISE · 贪玩游戏
008 TW Deliver — 买量投放引擎 27 维标签理解与策略自动生成 · CTR/ROI/首日付费预测 74%/68%/64% · 投放成本 −3.27% ENTERPRISE · 贪玩游戏

FULL ARCHIVE ON GITHUB ↗

04

研究 — 学术轨迹

PAPERS / PATENTS / GRANTS

DIRECTION 01 · MoE EFFICIENCY

MoE 大模型效率优化

针对 Mixture-of-Experts 大模型的「容量—负载—通信」不可能三角，提出基于动态专家聚类与结构化压缩的统一框架。利用路由器语义嵌入能力在线重组专家拓扑，实现参数压缩 80%、吞吐提升 10-20%、负载方差降低 3 倍以上。

Breaking the MoE Trilemma NeurIPS 在投 · 一作
动态聚类 + 共享基底 + 极低秩残差适配器
异构精度方案（FP16 共享基 + INT4 残差）
两阶段层级路由策略 · 全对全（All-to-All）通信量大幅削减
中科院庙算平台「先知」兵推大模型落地验证

ARXIV 2510.02345 ↗

DIRECTION 02 · SPIKING-LLM

大模型脉冲化稀疏推理

揭示 Transformer 推理过程中存在类似脉冲神经网络的「积累-发放」动力学机制。证明仅 Top-5% 激活脉冲即保留 95%+ 推理准确率，而打乱脉冲时序则性能完全崩溃至 0%，表明 LLM 推理依赖动态时序轨迹而非静态特征重要性。

LLMs Think in Spikes NeurIPS 在投 · 一作
Spiking-LLM 统一框架 · 事件驱动视角
稀疏脉冲驱动推理 · 时序序列严格必要
残差连接 + LayerNorm → 积分发放机制
LLaMA-3 系列模型实证验证

UNDER REVIEW · ANONYMOUS

✦

技术栈 — 流动的工具箱

STACK IN FLUX

05

联系

SAY HELLO

实习 / 2027 校招 / 科研合作 / 有趣的智能体点子 — 都欢迎。
Usually replies faster than an agent loop finishes.

GitHub ↗@szdtzpj 友情链接 ↗核心合作者

已复制到剪贴板 ✦ COPIED