Transformer 架构

🧪 Transformer — 编解码架构

💡 自注意力 → 前馈 → 编码器堆叠 ×N · 交叉注意力连接编解码