Jin10 dados 26 de agosto, na madrugada de hoje, o Microsoft Research lançou o modelo de áudio inovador VibeVoice-1.5B. O VibeVoice-1.5B inaugurou várias grandes inovações tecnológicas no campo da voz: é capaz de sintetizar continuamente 90 minutos de voz realista de uma só vez, enquanto a maioria dos modelos anteriores só conseguia sintetizar vozes de até 60 minutos e apresentava problemas como desvio de timbre e interrupção semântica após 30 minutos.
Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
Modelo de áudio inovador de código aberto da Microsoft VibeVoice-1.5B
Jin10 dados 26 de agosto, na madrugada de hoje, o Microsoft Research lançou o modelo de áudio inovador VibeVoice-1.5B. O VibeVoice-1.5B inaugurou várias grandes inovações tecnológicas no campo da voz: é capaz de sintetizar continuamente 90 minutos de voz realista de uma só vez, enquanto a maioria dos modelos anteriores só conseguia sintetizar vozes de até 60 minutos e apresentava problemas como desvio de timbre e interrupção semântica após 30 minutos.