voxcom infer 偶现不稳定，有时候会推理完4096token（超过2分钟），

<img width="2070" height="1354" alt="Image" src="https://github.com/user-attachments/assets/21cba1cc-dd23-4ff2-a73a-95fb3bdf138a" />

如图的位置，voxcpm.py VoxCPMModel inference 有时候会推理完4096token（超过2分钟），如果把max_length设置的比较小比如1024，推理15s后结果音频是乱的且长度也不对应，在我的prompt_wav和prompt_text不对应时，会经常出现（概率大概有5%），当他们对应时，也会偶尔出现几次（不过概率比较低< 1%）

我的配置：voxcpm 1.0.5  torch==2.6.0  H20卡

我的部分demo：

`
  self.tts_model = VoxCPM(voxcpm_model_path=self.model_dir)
      def generate(self, text, prompt_wav_path, prompt_text=None, cfg=2.0, steps=10):
          try:
              wav = self.tts_model.generate(
                  text=text,
                  prompt_wav_path=prompt_wav_path,
                  prompt_text=prompt_text,  
                  cfg_value=cfg,
                  inference_timesteps=steps,
                  normalize=False,
                  denoise=False,
                  retry_badcase=False,
                  max_length=1024,
              )
              return 16000, wav
`




Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

voxcom infer 偶现不稳定，有时候会推理完4096token（超过2分钟）， #124

Metadata

Assignees

Labels

Type

Projects

Milestone

Relationships

Development

voxcom infer 偶现不稳定，有时候会推理完4096token（超过2分钟）， #124

Description

Metadata

Metadata

Assignees

Labels

Type

Projects

Milestone

Relationships

Development

Issue actions