AI AGENT ENGINEER ✦ RESEARCHER — BASED IN GUANGZHOU
PEIJUN
ZHU
祝培竣
构建会思考、会协作、会自我进化的智能体系统。
从模型微调到多智能体落地 — Multi-Agent / MoE / RAG / 3DGS。
↓ 向下探索
点击 ATLAS 液体球,让 AI 协助你了解我
23.1838°N · 113.4870°E
FLUID FIELD v2.6
MULTI-AGENT SYSTEMS✦MIXTURE-OF-EXPERTS✦RAG PIPELINES✦3D GAUSSIAN SPLATTING✦SPIKING LLM✦CROSS-MODAL ALIGNMENT✦AGENT ORCHESTRATION✦
MULTI-AGENT SYSTEMS✦MIXTURE-OF-EXPERTS✦RAG PIPELINES✦3D GAUSSIAN SPLATTING✦SPIKING LLM✦CROSS-MODAL ALIGNMENT✦AGENT ORCHESTRATION✦
我相信下一代软件不是被使用的工具,而是会协作的同事——我在大模型与多智能体的交叉地带工作,让 Agent 学会拆解任务、调用工具、彼此协商,
并在真实业务里交付可量化的结果。
“I build systems that think in swarms — fluid, self-evolving, accountable.”
0
段大厂 Agent 研发实习
联通 · 软通动力 · 贪玩
0+
学术论文 & 知识产权
SCI Q1 · EI · 发明专利 ×4 · 软著 ×12
0
论文被引
Google Scholar Citations
0+
博客获赞与收藏
技术分享 · 社区贡献
0
GitHub Contributions
开源代码 · 持续活跃
0★
个人开源项目获得
BREAKING THE MOE TRILEMMA
02
经历 — 时间线
DRAG THROUGH TIME →
01
2024.09 — 2025.03
中国联通
技术部
AI AGENT 工程师
- 元景大模型 × 高速泛安防 — 纯视觉车辆检测 / 违章识别 / 路况监测,推理链路优化后端到端延迟 <50ms,联合判准率 99.17%,支撑全省高速智能监控。
- HIMO-CLIP 跨模态对齐框架 — HiDe 层次化解构 + MoLo 单调性损失,不改编码器建模语义层级,跨模态检索精度 +25%。
#CV#CLIP#大模型二次开发
02
2025.03 — 2025.09
软通动力
DEIC 智算中心
AGENT 研发工程师
- 众联多式联运物流 Agent中标项目 — GPS/订单/路况多源融合的自动化调度与车货匹配,订单达成率 +27%,支撑日均万级订单。
- AI4S 科研辅助系统 — 文献检索→数据处理→模型训练→结果分析全链 Agent,人在回路综合提效 40%。
- 美洲大豆量化预测 Agent中标项目 — 气象/期货/种植多源时序建模与因子挖掘,输出跨境贸易策略。
#Multi-Agent#AI4S#时序量化
03
2025.09 — NOW
贪玩游戏
AI 效率部
AI 研发工程师(AI AGENT)
- TW Agent 智能体引擎 — 基于 OpenClaw 的企业级多智能体协同:任务拆解 / 工具调用 / 流程编排全自动,隔离容器 + 权限审计,飞书工作台深度联动,团队提效 42%。
- TW Deliver 买量投放引擎 — 27 维标签理解与策略自动生成,CTR / ROI / 首日付费预测 74% / 68% / 64%,计划投放成本 −3.27%。
#Agent引擎#投放智能#权限与审计
NEXT
= YOU?
下一段旅程,与你的团队 →
03
精选项目
SELECTED WORKS 2024—26
04
研究 — 学术轨迹
PAPERS / PATENTS / GRANTS
DIRECTION 01 · MoE EFFICIENCY
MoE 大模型效率优化
针对 Mixture-of-Experts 大模型的「容量—负载—通信」不可能三角,提出基于动态专家聚类与结构化压缩的统一框架。利用路由器语义嵌入能力在线重组专家拓扑,实现参数压缩 80%、吞吐提升 10-20%、负载方差降低 3 倍以上。
- Breaking the MoE Trilemma NeurIPS 在投 · 一作
- 动态聚类 + 共享基底 + 极低秩残差适配器
- 异构精度方案(FP16 共享基 + INT4 残差)
- 两阶段层级路由策略 · 全to全通信量大幅削减
- 中科院庙算平台「先知」兵推大模型落地验证
ARXIV 2510.02345 ↗
DIRECTION 02 · SPIKING-LLM
大模型脉冲化稀疏推理
揭示 Transformer 推理过程中存在类似脉冲神经网络的「积累-发放」动力学机制。证明仅 Top-5% 激活脉冲即保留 95%+ 推理准确率,而打乱脉冲时序则性能完全崩溃至 0%,表明 LLM 推理依赖动态时序轨迹而非静态特征重要性。
- LLMs Think in Spikes NeurIPS 在投 · 一作
- Spiking-LLM 统一框架 · 事件驱动视角
- 稀疏脉冲驱动推理 · 时序序列严格必要
- 残差连接 + LayerNorm → 积分发放机制
- LLaMA-3 系列模型实证验证
UNDER REVIEW · ANONYMOUS
✦
技术栈 — 流动的工具箱
STACK IN FLUX
PYTHON·C++·PYTORCH·TENSORFLOW·CUDA·HUGGINGFACE·VLLM·OLLAMA·
PYTHON·C++·PYTORCH·TENSORFLOW·CUDA·HUGGINGFACE·VLLM·OLLAMA·
LANGGRAPH·LANGCHAIN·DIFY·RAG·MCP·OPENCLAW·MULTI-AGENT·FLOW 编排·
LANGGRAPH·LANGCHAIN·DIFY·RAG·MCP·OPENCLAW·MULTI-AGENT·FLOW 编排·
MIXTURE-OF-EXPERTS·3D GAUSSIAN SPLATTING·CLIP·SNN·时序预测·蒸馏·DOCKER·权限审计·
MIXTURE-OF-EXPERTS·3D GAUSSIAN SPLATTING·CLIP·SNN·时序预测·蒸馏·DOCKER·权限审计·