今天,DeepSeek全新系列模型DeepSeek-V4的预览版本正式上线并同步开源。 1.上下文 两款模型DeepSeek-V4-Pro以及DeepSeek-V4-Flash均支持1M 上下文长度,最大输出384K tokens。 DeepSeek-V4采用全新注意力机制,在token维度进行压缩