GPD Win Max 2 偶发蓝屏故障分析 (IRQ)

故障现象

  • 设备:GPD Win Max 2 (G1619-04), AMD 7840U + Radeon 780M
  • 系统:Windows 10 IoT 企业版 LTSC 2021 (Build 19044)
  • 内存:64GB DDR5 (4×16GB Micron @ 7500MT/s)
  • 硬盘:2TB NVMe PCIe 4.0 (CWESR02TBTLCZ)
  • 蓝屏偶发,已记录 4 次不同错误码的崩溃

MiniDump 分析结果

C:\Windows\Minidump 目录下共 4 个 dump 文件,均为 PAGE DU64 格式:

文件名 时间 错误码 含义
062526-12312-01.dmp 2026-06-25 18:32 0x0000000A IRQL_NOT_LESS_OR_EQUAL ← 最新
061726-10984-01.dmp 2026-06-17 10:27 0x00000050 PAGE_FAULT_IN_NONPAGED_AREA
061226-10375-01.dmp 2026-06-12 11:23 0x00000139 KERNEL_SECURITY_CHECK_FAILURE
041326-10640-01.dmp 2026-04-13 14:33 0x00000113 VIDEO_DXGKRNL_ERROR

最新崩溃参数 (0x0A)

  • IRQL: 0x38 (56) = HIGH_LEVEL_IRQL
  • 访问地址: 0x0000000000000002 (接近 NULL,大概率空指针解引用)
  • 访问类型: 0 (读操作)
  • 指令指针: 0xFFFFF80108214F70 (内核态地址)

根因排查(基于实际分析)

1. DDR5 内存稳定性 ⚡ ← 最高嫌疑

关键证据:连续 4 次蓝屏错误码各不相同(0x0A → 0x50 → 0x139 → 0x113),这是内存不稳定的典型特征。单一驱动问题通常产生相同或相似的错误码。

风险因素

  • DDR5 @ 7500MT/s 在 GPD 紧凑主板上是极高的频率
  • 4×16GB 双面颗粒对内存控制器压力大
  • 780M iGPU 共享系统内存,内存错误可直接导致 VIDEO_DXGKRNL_ERROR (0x113)
  • 7840U 的内存控制器在双通道 4-Rank 配置下容易不稳定

解法

  1. 运行 Windows 内存诊断(可能需要跑完整两轮)
  2. TestMem5 (TM5) 跑 Anta777 Extreme 配置
  3. 如果确认内存不稳,到 BIOS 中将内存降频到 5600MT/s 或 5200MT/s
  4. 或者尝试更新 GPD 官方 BIOS(可能已包含内存兼容性修复)

2. AMD GPIO 驱动冲突

驱动现状

  • AMD GPIO Controller: v2.2.0.137 (2026/3/22) — 较新版本
  • AMD GPIO Client Driver (amdgpio2): Running
  • AMD I2C Controller: v1.2.0.126 (2025/9/9)
  • 系统内核: 19044 (Win10 LTSC 2021, 源自 2021 年)

虽然驱动版本较新,但 LTSC 2021 的内核较旧(~2021),可能存在 GPIO 驱动与老内核的兼容问题。0x0A 的 IRQL=56 (HIGH_LEVEL) 确实指向中断处理层面的异常。

解法:从 GPD 官方芯片组驱动包重新安装 GPIO/SPI/I2C 驱动。

3. NVMe SSD 电源状态转换 (ASPM/L1)

已记录关闭命令:

powercfg -setacvalueindex scheme_current sub_disk 0b2d69d7-a2a1-449c-9680-f91c70521c60 0
powercfg -setdcvalueindex scheme_current sub_disk 0b2d69d7-a2a1-449c-9680-f91c70521c60 0
powercfg /setactive scheme_current

4. AMD iGPU Radeon 780M 驱动

驱动现状:AMD Radeon 780M Graphics — v32.0.31019.2002 (2026/5/29),日期很新。但 0x113 VIDEO_DXGKRNL_ERROR 表明 GPU 曾经超时或崩溃。这可能是内存问题导致的(iGPU 使用系统内存),也可能是驱动本身问题。建议在排除内存问题后再考虑。

立刻操作

  1. ✅ 已检查 C:\Windows\Minidump — 包含 4 个 dump
  2. ✅ 已查看 AMD GPIO Controller 驱动版本 — v2.2.0.137 (相对较新)
  3. 🔲 跑 Windows 内存诊断(最重要)
  4. 🔲 检查 GPD 官方是否有新 BIOS 更新

结论

最大可能:DDR5 内存高频率下的稳定性问题。4 次不同错误码的蓝屏(IRQL、页错误、安全检查、显卡超时)高度指向内存子系统。建议优先跑内存诊断或降频到 5600MT/s 验证。如果降频后蓝屏消失,则为内存问题;如果只出 0x0A,则指向 GPIO 驱动。