下方每个入口对应单独一页,主题互不混排。可通过顶栏随时切换不同学习方向。
多模态在做什么、视觉—语言与文档对齐、统一序列与常见架构组件。
预训练、指令微调与偏好对齐,以及多模态训练中的冻结策略与数据配比。
KV Cache、量化、服务化与多模态前后处理、观测与降级思路。
幻觉、偏见与滥用风险,以及合规与能力边界设计要点。
客服/电商/教育/媒体等典型方向,以及落地前需明确的模态、延迟与安全红线。