算力建议 (20GB VRAM)
- 轻量化展示: 采用摘要优先策略,减少实时显存占用。
- 切片处理: 针对长视频开启 10min 滚动切片模式。
- 动态权重: 核心对象 5s 轮询,非核心对象 5min 轮询。
Token 切分估算
64000
* 针对超长内容,系统会自动触发分段策略,确保 LLM 总结任务不会超出单次 Context Window 限制。