上传课堂录像 → 结构化分析 → 教学质量评估
absdiff过滤 → YOLO检测 → 阈值触发VLM
低于此值跳过静止帧 (越大=跳过更多)
帧差超过此值时强制调用 VLM
即使无异常,也每隔此时间调用一次 VLM
降低分辨率可加速 VLM 分析
每批发送给 LLM 的语音片段数量,越大越快