AI AGENT ENGINEER ✦ RESEARCHER — BASED IN GUANGZHOU

PEIJUN ZHU 祝培竣

构建会思考、会协作、会自我进化的智能体系统。
从模型微调到多智能体落地 — Multi-Agent / MoE / RAG / 3DGS。

  • NOW — 贪玩 · AI效率部 · Agent研发
  • 广州大学 人工智能 BSc '27
  • SCI Q1 ×1 · NeurIPS 在投 ×2
向下探索
01

关于 — 宣言

MANIFESTO

我相信下一代软件不是被使用的工具,而是会协作的同事——我在大模型与多智能体的交叉地带工作,让 Agent 学会拆解任务、调用工具、彼此协商, 并在真实业务里交付可量化的结果。

“I build systems that think in swarms — fluid, self-evolving, accountable.”

0 段大厂 Agent 研发实习
联通 · 软通动力 · 贪玩
0+ 学术论文 & 知识产权
SCI Q1 · EI · 发明专利 ×4 · 软著 ×12
0 论文被引
Google Scholar Citations
0+ 博客获赞与收藏
技术分享 · 社区贡献
0 GitHub Contributions
开源代码 · 持续活跃
0 个人开源项目获得
BREAKING THE MOE TRILEMMA
02

经历 — 时间线

DRAG THROUGH TIME →
01 2024.09 — 2025.03

中国联通技术部

AI AGENT 工程师

  • 元景大模型 × 高速泛安防 — 纯视觉车辆检测 / 违章识别 / 路况监测,推理链路优化后端到端延迟 <50ms,联合判准率 99.17%,支撑全省高速智能监控。
  • HIMO-CLIP 跨模态对齐框架 — HiDe 层次化解构 + MoLo 单调性损失,不改编码器建模语义层级,跨模态检索精度 +25%
#CV#CLIP#大模型二次开发
02 2025.03 — 2025.09

软通动力DEIC 智算中心

AGENT 研发工程师

  • 众联多式联运物流 Agent中标项目 — GPS/订单/路况多源融合的自动化调度与车货匹配,订单达成率 +27%,支撑日均万级订单。
  • AI4S 科研辅助系统 — 文献检索→数据处理→模型训练→结果分析全链 Agent,人在回路综合提效 40%
  • 美洲大豆量化预测 Agent中标项目 — 气象/期货/种植多源时序建模与因子挖掘,输出跨境贸易策略。
#Multi-Agent#AI4S#时序量化
03 2025.09 — NOW

贪玩游戏AI 效率部

AI 研发工程师(AI AGENT)

  • TW Agent 智能体引擎 — 基于 OpenClaw 的企业级多智能体协同:任务拆解 / 工具调用 / 流程编排全自动,隔离容器 + 权限审计,飞书工作台深度联动,团队提效 42%
  • TW Deliver 买量投放引擎 — 27 维标签理解与策略自动生成,CTR / ROI / 首日付费预测 74% / 68% / 64%,计划投放成本 −3.27%
#Agent引擎#投放智能#权限与审计
03

精选项目

SELECTED WORKS 2024—26

FULL ARCHIVE ON GITHUB ↗

04

研究 — 学术轨迹

PAPERS / PATENTS / GRANTS
DIRECTION 01 · MoE EFFICIENCY

MoE 大模型效率优化

针对 Mixture-of-Experts 大模型的「容量—负载—通信」不可能三角,提出基于动态专家聚类与结构化压缩的统一框架。利用路由器语义嵌入能力在线重组专家拓扑,实现参数压缩 80%、吞吐提升 10-20%、负载方差降低 3 倍以上。

  • Breaking the MoE Trilemma NeurIPS 在投 · 一作
  • 动态聚类 + 共享基底 + 极低秩残差适配器
  • 异构精度方案(FP16 共享基 + INT4 残差)
  • 两阶段层级路由策略 · 全to全通信量大幅削减
  • 中科院庙算平台「先知」兵推大模型落地验证
ARXIV 2510.02345 ↗
DIRECTION 02 · SPIKING-LLM

大模型脉冲化稀疏推理

揭示 Transformer 推理过程中存在类似脉冲神经网络的「积累-发放」动力学机制。证明仅 Top-5% 激活脉冲即保留 95%+ 推理准确率,而打乱脉冲时序则性能完全崩溃至 0%,表明 LLM 推理依赖动态时序轨迹而非静态特征重要性。

  • LLMs Think in Spikes NeurIPS 在投 · 一作
  • Spiking-LLM 统一框架 · 事件驱动视角
  • 稀疏脉冲驱动推理 · 时序序列严格必要
  • 残差连接 + LayerNorm → 积分发放机制
  • LLaMA-3 系列模型实证验证
UNDER REVIEW · ANONYMOUS

技术栈 — 流动的工具箱

STACK IN FLUX
05

联系

SAY HELLO

实习 / 2027 校招 / 科研合作 / 有趣的智能体点子 — 都欢迎。
Usually replies faster than an agent loop finishes.

已复制到剪贴板 ✦ COPIED