tts-bench — Listen

Prompt 1 [en] "Open the browser and read my email."

Default voice (40)

Model	Size	Source
Chatterbox	1.2B	win·cuda
Chatterbox Turbo	744M	win·cuda
Coqui XTTS-v2	750M	win·cuda
Dia 1.6B-0626	1.6B	win·cuda
dots.tts (soar) ⟳ voice varies	2B	linux·cuda
DramaBox	3.3B	win·cuda
F5-TTS v1	330M	win·cuda
Higgs Audio v3 TTS ⟳ voice varies	4B	linux·cuda
IndexTTS-2	1.5B	win·cuda
KittenTTS Nano 0.1	<100M	win·cpu
Kokoro	82M	win·cuda
LFM2.5-Audio 1.5B	1.5B	win·cuda
LongCat-AudioDiT 1B ⟳ voice varies	1.42B	win·cuda
LongCat-AudioDiT 3.5B ⟳ voice varies	3.83B	win·cuda
LuxTTS	123M	linux·cuda
Magpie-TTS	357M	win·cuda
Mars5-TTS	1.2B	win·cuda
Maya1	3B	win·cuda
MeloTTS	~52M	win·cuda
MiraTTS	0.5B	linux·cuda
Miso TTS 8B ⚠ artifacts	8.2B	win·cuda
NeuTTS Air	748M	win·cuda
NeuTTS Nano	229M	win·cuda
OmniVoice	~1B	win·cuda
Orpheus-TTS 3B	3.3B	linux·cuda
OuteTTS 1.0 1B	1B	win·cuda
Parler-TTS Mini v1	878M	win·cuda
Piper	~25MB	win·cpu
Pocket-TTS	100M	win·cpu
Qwen3-TTS 1.7B (CUDA-graph)	1.7B	win·cuda
Qwen3-TTS 1.7B Base	1.7B	win·cuda
Scylla's Band	~103M	win·cpu
Sesame CSM-1B	1B	win·cuda
Soprano 1.1 80M	80M	win·cuda
Step-Audio-EditX	3B	linux·cuda
StyleTTS 2	~148M	win·cuda
Supertonic 3	99M	win·cpu
VibeVoice Realtime 0.5B	0.5B	win·cuda
VoxCPM2 2B	2B	win·cuda
Voxtral 4B TTS	4B	mac·mps

Cloning — chris_hemsworth (42)

▶ Reference voice — the target each clone imitates:

Model	Size	Source
Chatterbox	1.2B	win·cuda
Chatterbox Turbo	744M	win·cuda
Coqui XTTS-v2	750M	win·cuda
CosyVoice 3 0.5B ⟳ length varies	0.5B	linux·cuda
Dia 1.6B-0626	1.6B	win·cuda
dots.tts (soar)	2B	linux·cuda
DramaBox	3.3B	win·cuda
Echo-TTS	2.8B	win·cuda
F5-TTS v1	330M	win·cuda
Fish Speech 1.5	~500M	win·cuda
Fish Speech S2-Pro	4B	linux·cuda
Higgs Audio v3 TTS	4B	linux·cuda
IndexTTS-2	1.5B	win·cuda
LongCat-AudioDiT 1B	1.42B	win·cuda
LongCat-AudioDiT 3.5B ⟳ clone less reliable	3.83B	win·cuda
LuxTTS	123M	linux·cuda
Mars5-TTS	1.2B	win·cuda
MetaVoice-1B	1.2B	linux·cuda
MioTTS 0.1B	0.1B	linux·cuda
MioTTS 0.6B ⟳ length varies	0.6B	linux·cuda
MiraTTS	0.5B	win·cuda
Miso TTS 8B ⟳ clone unstable	8.2B	win·cuda
MOSS-TTS v1.0	8B	win·cuda
MOSS-TTS v1.5	8B	win·cuda
MOSS-TTS-Nano	100M	win·cuda
NeuTTS Air	748M	win·cuda
NeuTTS Nano	229M	win·cuda
OmniVoice	~1B	win·cuda
OpenVoice v2	~100M	win·cuda
OuteTTS 1.0 1B	1B	win·cuda
Pocket-TTS	100M	win·cpu
Qwen3-TTS 1.7B (CUDA-graph)	1.7B	win·cuda
Sesame CSM-1B	1B	win·cuda
Step-Audio-EditX	3B	linux·cuda
StyleTTS 2	~148M	win·cuda
VibeVoice 1.5B	1.5B	win·cuda
VibeVoice 7B	7B	win·cuda
VoxCPM2 2B	2B	win·cuda
WavTTS 0.67B	0.67B	win·cuda
ZipVoice 123M	123M	win·cuda
Zonos v0.1	1.6B	win·cuda
Zonos2	8B (MoE, ~900M active)	linux·cuda

Prompt 2 [en] "I'll start a new git branch, push the changes, and open a pull request when the tests pass."

Default voice (40)

Model	Size	Source
Chatterbox	1.2B	win·cuda
Chatterbox Turbo	744M	win·cuda
Coqui XTTS-v2	750M	win·cuda
Dia 1.6B-0626	1.6B	win·cuda
dots.tts (soar) ⟳ voice varies	2B	linux·cuda
DramaBox	3.3B	win·cuda
F5-TTS v1	330M	win·cuda
Higgs Audio v3 TTS ⟳ voice varies	4B	linux·cuda
IndexTTS-2	1.5B	win·cuda
KittenTTS Nano 0.1	<100M	win·cpu
Kokoro	82M	win·cuda
LFM2.5-Audio 1.5B	1.5B	win·cuda
LongCat-AudioDiT 1B ⟳ voice varies	1.42B	win·cuda
LongCat-AudioDiT 3.5B ⟳ voice varies	3.83B	win·cuda
LuxTTS	123M	linux·cuda
Magpie-TTS	357M	win·cuda
Mars5-TTS	1.2B	win·cuda
Maya1	3B	win·cuda
MeloTTS	~52M	win·cuda
MiraTTS	0.5B	linux·cuda
Miso TTS 8B ⚠ artifacts	8.2B	win·cuda
NeuTTS Air	748M	win·cuda
NeuTTS Nano	229M	win·cuda
OmniVoice	~1B	win·cuda
Orpheus-TTS 3B	3.3B	linux·cuda
OuteTTS 1.0 1B	1B	win·cuda
Parler-TTS Mini v1	878M	win·cuda
Piper	~25MB	win·cpu
Pocket-TTS	100M	win·cpu
Qwen3-TTS 1.7B (CUDA-graph)	1.7B	win·cuda
Qwen3-TTS 1.7B Base	1.7B	win·cuda
Scylla's Band	~103M	win·cpu
Sesame CSM-1B	1B	win·cuda
Soprano 1.1 80M	80M	win·cuda
Step-Audio-EditX	3B	linux·cuda
StyleTTS 2	~148M	win·cuda
Supertonic 3	99M	win·cpu
VibeVoice Realtime 0.5B	0.5B	win·cuda
VoxCPM2 2B	2B	win·cuda
Voxtral 4B TTS	4B	mac·mps

Cloning — chris_hemsworth (42)

▶ Reference voice — the target each clone imitates:

Model	Size	Source
Chatterbox	1.2B	win·cuda
Chatterbox Turbo	744M	win·cuda
Coqui XTTS-v2	750M	win·cuda
CosyVoice 3 0.5B ⟳ length varies	0.5B	linux·cuda
Dia 1.6B-0626	1.6B	win·cuda
dots.tts (soar)	2B	linux·cuda
DramaBox	3.3B	win·cuda
Echo-TTS	2.8B	win·cuda
F5-TTS v1	330M	win·cuda
Fish Speech 1.5	~500M	win·cuda
Fish Speech S2-Pro	4B	linux·cuda
Higgs Audio v3 TTS	4B	linux·cuda
IndexTTS-2	1.5B	win·cuda
LongCat-AudioDiT 1B	1.42B	win·cuda
LongCat-AudioDiT 3.5B ⟳ clone less reliable	3.83B	win·cuda
LuxTTS	123M	linux·cuda
Mars5-TTS	1.2B	win·cuda
MetaVoice-1B	1.2B	linux·cuda
MioTTS 0.1B	0.1B	linux·cuda
MioTTS 0.6B ⟳ length varies	0.6B	linux·cuda
MiraTTS	0.5B	win·cuda
Miso TTS 8B ⟳ clone unstable	8.2B	win·cuda
MOSS-TTS v1.0	8B	win·cuda
MOSS-TTS v1.5	8B	win·cuda
MOSS-TTS-Nano	100M	win·cuda
NeuTTS Air	748M	win·cuda
NeuTTS Nano	229M	win·cuda
OmniVoice	~1B	win·cuda
OpenVoice v2	~100M	win·cuda
OuteTTS 1.0 1B	1B	win·cuda
Pocket-TTS	100M	win·cpu
Qwen3-TTS 1.7B (CUDA-graph)	1.7B	win·cuda
Sesame CSM-1B	1B	win·cuda
Step-Audio-EditX	3B	linux·cuda
StyleTTS 2	~148M	win·cuda
VibeVoice 1.5B	1.5B	win·cuda
VibeVoice 7B	7B	win·cuda
VoxCPM2 2B	2B	win·cuda
WavTTS 0.67B	0.67B	win·cuda
ZipVoice 123M	123M	win·cuda
Zonos v0.1	1.6B	win·cuda
Zonos2	8B (MoE, ~900M active)	linux·cuda

Prompt 3 [en] "The Parakeet TDT zero point six billion parameter model achieves one point six nine percent word error rate on LibriSpeech test-clean, beating Whisper Large V3 at two point seven percent while running at over two thousand times realtime on a single GPU."

Default voice (40)

Model	Size	Source
Chatterbox	1.2B	win·cuda
Chatterbox Turbo	744M	win·cuda
Coqui XTTS-v2	750M	win·cuda
Dia 1.6B-0626	1.6B	win·cuda
dots.tts (soar) ⟳ voice varies	2B	linux·cuda
DramaBox	3.3B	win·cuda
F5-TTS v1	330M	win·cuda
Higgs Audio v3 TTS ⟳ voice varies	4B	linux·cuda
IndexTTS-2	1.5B	win·cuda
KittenTTS Nano 0.1	<100M	win·cpu
Kokoro	82M	win·cuda
LFM2.5-Audio 1.5B	1.5B	win·cuda
LongCat-AudioDiT 1B ⟳ voice varies	1.42B	win·cuda
LongCat-AudioDiT 3.5B ⟳ voice varies	3.83B	win·cuda
LuxTTS	123M	linux·cuda
Magpie-TTS	357M	win·cuda
Mars5-TTS	1.2B	win·cuda
Maya1	3B	win·cuda
MeloTTS	~52M	win·cuda
MiraTTS	0.5B	linux·cuda
Miso TTS 8B ⚠ artifacts	8.2B	win·cuda
NeuTTS Air	748M	win·cuda
NeuTTS Nano	229M	win·cuda
OmniVoice	~1B	win·cuda
Orpheus-TTS 3B	3.3B	linux·cuda
OuteTTS 1.0 1B	1B	win·cuda
Parler-TTS Mini v1	878M	win·cuda
Piper	~25MB	win·cpu
Pocket-TTS	100M	win·cpu
Qwen3-TTS 1.7B (CUDA-graph)	1.7B	win·cuda
Qwen3-TTS 1.7B Base	1.7B	win·cuda
Scylla's Band	~103M	win·cpu
Sesame CSM-1B	1B	win·cuda
Soprano 1.1 80M	80M	win·cuda
Step-Audio-EditX	3B	linux·cuda
StyleTTS 2	~148M	win·cuda
Supertonic 3	99M	win·cpu
VibeVoice Realtime 0.5B	0.5B	win·cuda
VoxCPM2 2B	2B	win·cuda
Voxtral 4B TTS	4B	mac·mps

Cloning — chris_hemsworth (42)

▶ Reference voice — the target each clone imitates:

Model	Size	Source
Chatterbox	1.2B	win·cuda
Chatterbox Turbo	744M	win·cuda
Coqui XTTS-v2	750M	win·cuda
CosyVoice 3 0.5B ⟳ length varies	0.5B	linux·cuda
Dia 1.6B-0626	1.6B	win·cuda
dots.tts (soar)	2B	linux·cuda
DramaBox	3.3B	win·cuda
Echo-TTS	2.8B	win·cuda
F5-TTS v1	330M	win·cuda
Fish Speech 1.5	~500M	win·cuda
Fish Speech S2-Pro	4B	linux·cuda
Higgs Audio v3 TTS	4B	linux·cuda
IndexTTS-2	1.5B	win·cuda
LongCat-AudioDiT 1B	1.42B	win·cuda
LongCat-AudioDiT 3.5B ⟳ clone less reliable	3.83B	win·cuda
LuxTTS	123M	linux·cuda
Mars5-TTS	1.2B	win·cuda
MetaVoice-1B	1.2B	linux·cuda
MioTTS 0.1B	0.1B	linux·cuda
MioTTS 0.6B ⟳ length varies	0.6B	linux·cuda
MiraTTS	0.5B	win·cuda
Miso TTS 8B ⟳ clone unstable	8.2B	win·cuda
MOSS-TTS v1.0	8B	win·cuda
MOSS-TTS v1.5	8B	win·cuda
MOSS-TTS-Nano	100M	win·cuda
NeuTTS Air	748M	win·cuda
NeuTTS Nano	229M	win·cuda
OmniVoice	~1B	win·cuda
OpenVoice v2	~100M	win·cuda
OuteTTS 1.0 1B	1B	win·cuda
Pocket-TTS	100M	win·cpu
Qwen3-TTS 1.7B (CUDA-graph)	1.7B	win·cuda
Sesame CSM-1B	1B	win·cuda
Step-Audio-EditX	3B	linux·cuda
StyleTTS 2	~148M	win·cuda
VibeVoice 1.5B	1.5B	win·cuda
VibeVoice 7B	7B	win·cuda
VoxCPM2 2B	2B	win·cuda
WavTTS 0.67B	0.67B	win·cuda
ZipVoice 123M	123M	win·cpu
Zonos v0.1	1.6B	win·cuda
Zonos2	8B (MoE, ~900M active)	linux·cuda

Prompt 4 [en] "Run pytest tests slash test underscore voice dot py with verbose flag and capture flag set to no."

Default voice (40)

Model	Size	Source
Chatterbox	1.2B	win·cuda
Chatterbox Turbo	744M	win·cuda
Coqui XTTS-v2	750M	win·cuda
Dia 1.6B-0626	1.6B	win·cuda
dots.tts (soar) ⟳ voice varies	2B	linux·cuda
DramaBox	3.3B	win·cuda
F5-TTS v1	330M	win·cuda
Higgs Audio v3 TTS ⟳ voice varies	4B	linux·cuda
IndexTTS-2	1.5B	win·cuda
KittenTTS Nano 0.1	<100M	win·cpu
Kokoro	82M	win·cuda
LFM2.5-Audio 1.5B	1.5B	win·cuda
LongCat-AudioDiT 1B ⟳ voice varies	1.42B	win·cuda
LongCat-AudioDiT 3.5B ⟳ voice varies	3.83B	win·cuda
LuxTTS	123M	linux·cuda
Magpie-TTS	357M	win·cuda
Mars5-TTS	1.2B	win·cuda
Maya1	3B	win·cuda
MeloTTS	~52M	win·cuda
MiraTTS	0.5B	linux·cuda
Miso TTS 8B ⚠ artifacts	8.2B	win·cuda
NeuTTS Air	748M	win·cuda
NeuTTS Nano	229M	win·cuda
OmniVoice	~1B	win·cuda
Orpheus-TTS 3B	3.3B	linux·cuda
OuteTTS 1.0 1B	1B	win·cuda
Parler-TTS Mini v1	878M	win·cuda
Piper	~25MB	win·cpu
Pocket-TTS	100M	win·cpu
Qwen3-TTS 1.7B (CUDA-graph)	1.7B	win·cuda
Qwen3-TTS 1.7B Base	1.7B	win·cuda
Scylla's Band	~103M	win·cpu
Sesame CSM-1B	1B	win·cuda
Soprano 1.1 80M	80M	win·cuda
Step-Audio-EditX	3B	linux·cuda
StyleTTS 2	~148M	win·cuda
Supertonic 3	99M	win·cpu
VibeVoice Realtime 0.5B	0.5B	win·cuda
VoxCPM2 2B	2B	win·cuda
Voxtral 4B TTS	4B	mac·mps

Cloning — chris_hemsworth (42)

▶ Reference voice — the target each clone imitates:

Model	Size	Source
Chatterbox	1.2B	win·cuda
Chatterbox Turbo	744M	win·cuda
Coqui XTTS-v2	750M	win·cuda
CosyVoice 3 0.5B ⟳ length varies	0.5B	linux·cuda
Dia 1.6B-0626	1.6B	win·cuda
dots.tts (soar)	2B	linux·cuda
DramaBox	3.3B	win·cuda
Echo-TTS	2.8B	win·cuda
F5-TTS v1	330M	win·cuda
Fish Speech 1.5	~500M	win·cuda
Fish Speech S2-Pro	4B	linux·cuda
Higgs Audio v3 TTS	4B	linux·cuda
IndexTTS-2	1.5B	win·cuda
LongCat-AudioDiT 1B	1.42B	win·cuda
LongCat-AudioDiT 3.5B ⟳ clone less reliable	3.83B	win·cuda
LuxTTS	123M	linux·cuda
Mars5-TTS	1.2B	win·cuda
MetaVoice-1B	1.2B	linux·cuda
MioTTS 0.1B	0.1B	linux·cuda
MioTTS 0.6B ⟳ length varies	0.6B	linux·cuda
MiraTTS	0.5B	win·cuda
Miso TTS 8B ⟳ clone unstable	8.2B	win·cuda
MOSS-TTS v1.0	8B	win·cuda
MOSS-TTS v1.5	8B	win·cuda
MOSS-TTS-Nano	100M	win·cuda
NeuTTS Air	748M	win·cuda
NeuTTS Nano	229M	win·cuda
OmniVoice	~1B	win·cuda
OpenVoice v2	~100M	win·cuda
OuteTTS 1.0 1B	1B	win·cuda
Pocket-TTS	100M	win·cpu
Qwen3-TTS 1.7B (CUDA-graph)	1.7B	win·cuda
Sesame CSM-1B	1B	win·cuda
Step-Audio-EditX	3B	linux·cuda
StyleTTS 2	~148M	win·cuda
VibeVoice 1.5B	1.5B	win·cuda
VibeVoice 7B	7B	win·cuda
VoxCPM2 2B	2B	win·cuda
WavTTS 0.67B	0.67B	win·cuda
ZipVoice 123M	123M	win·cuda
Zonos v0.1	1.6B	win·cuda
Zonos2	8B (MoE, ~900M active)	linux·cuda

Prompt 5 [fr] "Bonjour, je m'appelle Cicero et je vais vous aider avec votre code aujourd'hui."

Default voice (16)

Model	Size	Source
Coqui XTTS-v2	750M	win·cuda
dots.tts (soar) ⟳ voice varies	2B	linux·cuda
Higgs Audio v3 TTS ⟳ voice varies	4B	linux·cuda
Kokoro	82M	win·cuda
Magpie-TTS	357M	win·cuda
MeloTTS	~52M	win·cuda
NeuTTS Nano	229M	win·cuda
OmniVoice	~1B	win·cuda
OuteTTS 1.0 1B	1B	win·cuda
Piper	~25MB	win·cpu
Pocket-TTS	100M	win·cpu
Qwen3-TTS 1.7B (CUDA-graph)	1.7B	win·cuda
Qwen3-TTS 1.7B Base	1.7B	win·cuda
Supertonic 3	99M	win·cpu
VoxCPM2 2B	2B	win·cuda
Voxtral 4B TTS	4B	mac·mps

Cloning — chris_hemsworth (17)

▶ Reference voice — the target each clone imitates:

Model	Size	Source
Coqui XTTS-v2	750M	win·cuda
CosyVoice 3 0.5B ⟳ length varies	0.5B	linux·cuda
dots.tts (soar)	2B	linux·cuda
Fish Speech 1.5	~500M	win·cuda
Higgs Audio v3 TTS	4B	linux·cuda
MOSS-TTS v1.0	8B	win·cuda
MOSS-TTS v1.5	8B	win·cuda
MOSS-TTS-Nano	100M	win·cuda
NeuTTS Nano	229M	win·cuda
OmniVoice	~1B	win·cuda
OpenVoice v2	~100M	win·cuda
OuteTTS 1.0 1B	1B	win·cuda
Pocket-TTS	100M	win·cpu
Qwen3-TTS 1.7B (CUDA-graph)	1.7B	win·cuda
VoxCPM2 2B	2B	win·cuda
ZipVoice 123M	123M	win·cuda
Zonos v0.1	1.6B	win·cuda

Chatterbox 1.2B · Apr 2025 clones

Default voice

Prompt	Source	Audio
P1	win·cuda
P2	win·cuda
P3	win·cuda
P4	win·cuda

Cloning — chris_hemsworth

▶ Reference voice:

Prompt	Source	Audio
P1	win·cuda
P2	win·cuda
P3	win·cuda
P4	win·cuda

Chatterbox Turbo 744M · Dec 2025 clones

Default voice

Prompt	Source	Audio
P1	win·cuda
P2	win·cuda
P3	win·cuda
P4	win·cuda

Cloning — chris_hemsworth

▶ Reference voice:

Prompt	Source	Audio
P1	win·cuda
P2	win·cuda
P3	win·cuda
P4	win·cuda

Coqui XTTS-v2 750M · Oct 2023 clonesmultilingual

Default voice

Prompt	Source	Audio
P1	win·cuda
P2	win·cuda
P3	win·cuda
P4	win·cuda
P5	win·cuda

Cloning — chris_hemsworth

▶ Reference voice:

Prompt	Source	Audio
P1	win·cuda
P2	win·cuda
P3	win·cuda
P4	win·cuda
P5	win·cuda

CosyVoice 3 0.5B 0.5B · Dec 2025 clonesmultilingual ⟳ length varies

Cloning — chris_hemsworth ⟳ length varies

▶ Reference voice:

Prompt	Source	Audio
P1	linux·cuda
P2	linux·cuda
P3	linux·cuda
P4	linux·cuda
P5	linux·cuda

Dia 1.6B-0626 1.6B · Jun 2025 clones

Default voice

Prompt	Source	Audio
P1	win·cuda
P2	win·cuda
P3	win·cuda
P4	win·cuda

Cloning — chris_hemsworth

▶ Reference voice:

Prompt	Source	Audio
P1	win·cuda
P2	win·cuda
P3	win·cuda
P4	win·cuda

dots.tts (soar) 2B · Jun 2026 clonesmultilingual ⟳ voice varies

Default voice ⟳ voice varies

Prompt	Source	Audio
P1	linux·cuda
P2	linux·cuda
P3	linux·cuda
P4	linux·cuda
P5	linux·cuda

Cloning — chris_hemsworth

▶ Reference voice:

Prompt	Source	Audio
P1	linux·cuda
P2	linux·cuda
P3	linux·cuda
P4	linux·cuda
P5	linux·cuda

DramaBox 3.3B · Apr 2026 clones

Default voice

Prompt	Source	Audio
P1	win·cuda
P2	win·cuda
P3	win·cuda
P4	win·cuda

Cloning — chris_hemsworth

▶ Reference voice:

Prompt	Source	Audio
P1	win·cuda
P2	win·cuda
P3	win·cuda
P4	win·cuda

Echo-TTS 2.8B · Dec 2025 clones

Cloning — chris_hemsworth

▶ Reference voice:

Prompt	Source	Audio
P1	win·cuda
P2	win·cuda
P3	win·cuda
P4	win·cuda

F5-TTS v1 330M · Oct 2024 clonesmultilingual

Default voice

Prompt	Source	Audio
P1	win·cuda
P2	win·cuda
P3	win·cuda
P4	win·cuda

Cloning — chris_hemsworth

▶ Reference voice:

Prompt	Source	Audio
P1	win·cuda
P2	win·cuda
P3	win·cuda
P4	win·cuda

Fish Speech 1.5 ~500M · Nov 2024 clonesmultilingual

Cloning — chris_hemsworth

▶ Reference voice:

Prompt	Source	Audio
P1	win·cuda
P2	win·cuda
P3	win·cuda
P4	win·cuda
P5	win·cuda

Fish Speech S2-Pro 4B · Mar 2026 clones

Cloning — chris_hemsworth

▶ Reference voice:

Prompt	Source	Audio
P1	linux·cuda
P2	linux·cuda
P3	linux·cuda
P4	linux·cuda

Higgs Audio v3 TTS 4B · Jun 2026 clonesmultilingual ⟳ voice varies

Default voice ⟳ voice varies

Prompt	Source	Audio
P1	linux·cuda
P2	linux·cuda
P3	linux·cuda
P4	linux·cuda
P5	linux·cuda

Cloning — chris_hemsworth

▶ Reference voice:

Prompt	Source	Audio
P1	linux·cuda
P2	linux·cuda
P3	linux·cuda
P4	linux·cuda
P5	linux·cuda

IndexTTS-2 1.5B · Jun 2025 clonesmultilingual

Default voice

Prompt	Source	Audio
P1	win·cuda
P2	win·cuda
P3	win·cuda
P4	win·cuda

Cloning — chris_hemsworth

▶ Reference voice:

Prompt	Source	Audio
P1	win·cuda
P2	win·cuda
P3	win·cuda
P4	win·cuda

KittenTTS Nano 0.1 <100M · Aug 2025 preset

Default voice

Prompt	Source	Audio
P1	win·cpu
P2	win·cpu
P3	win·cpu
P4	win·cpu

Kokoro 82M · Dec 2024 presetmultilingual

Default voice

Prompt	Source	Audio
P1	win·cuda
P2	win·cuda
P3	win·cuda
P4	win·cuda
P5	win·cuda

LFM2.5-Audio 1.5B 1.5B · Dec 2025 preset

Default voice

Prompt	Source	Audio
P1	win·cuda
P2	win·cuda
P3	win·cuda
P4	win·cuda

LongCat-AudioDiT 1B 1.42B · Mar 2026 clonesmultilingual ⟳ voice varies

Default voice ⟳ voice varies

Prompt	Source	Audio
P1	win·cuda
P2	win·cuda
P3	win·cuda
P4	win·cuda

Cloning — chris_hemsworth

▶ Reference voice:

Prompt	Source	Audio
P1	win·cuda
P2	win·cuda
P3	win·cuda
P4	win·cuda

LongCat-AudioDiT 3.5B 3.83B · Mar 2026 clonesmultilingual ⟳ voice varies ⟳ clone less reliable

Default voice ⟳ voice varies

Prompt	Source	Audio
P1	win·cuda
P2	win·cuda
P3	win·cuda
P4	win·cuda

Cloning — chris_hemsworth ⟳ clone less reliable

▶ Reference voice:

Prompt	Source	Audio
P1	win·cuda
P2	win·cuda
P3	win·cuda
P4	win·cuda

LuxTTS 123M · Jan 2026 preset

Default voice

Prompt	Source	Audio
P1	linux·cuda
P2	linux·cuda
P3	linux·cuda
P4	linux·cuda

Cloning — chris_hemsworth

▶ Reference voice:

Prompt	Source	Audio
P1	linux·cuda
P2	linux·cuda
P3	linux·cuda
P4	linux·cuda

Magpie-TTS 357M · Dec 2025 presetmultilingual

Default voice

Prompt	Source	Audio
P1	win·cuda
P2	win·cuda
P3	win·cuda
P4	win·cuda
P5	win·cuda

Mars5-TTS 1.2B · Jun 2024 clones

Default voice

Prompt	Source	Audio
P1	win·cuda
P2	win·cuda
P3	win·cuda
P4	win·cuda

Cloning — chris_hemsworth

▶ Reference voice:

Prompt	Source	Audio
P1	win·cuda
P2	win·cuda
P3	win·cuda
P4	win·cuda

Maya1 3B · Oct 2025 preset

Default voice

Prompt	Source	Audio
P1	win·cuda
P2	win·cuda
P3	win·cuda
P4	win·cuda

MeloTTS ~52M · Feb 2024 preset

Default voice

Prompt	Source	Audio
P1	win·cuda
P2	win·cuda
P3	win·cuda
P4	win·cuda
P5	win·cuda

MetaVoice-1B 1.2B · Feb 2024 clones

Cloning — chris_hemsworth

▶ Reference voice:

Prompt	Source	Audio
P1	linux·cuda
P2	linux·cuda
P3	linux·cuda
P4	linux·cuda

MioTTS 0.1B 0.1B · Feb 2026 clonesmultilingual

Cloning — chris_hemsworth

▶ Reference voice:

Prompt	Source	Audio
P1	linux·cuda
P2	linux·cuda
P3	linux·cuda
P4	linux·cuda

MioTTS 0.6B 0.6B · Feb 2026 clonesmultilingual ⟳ length varies

Cloning — chris_hemsworth ⟳ length varies

▶ Reference voice:

Prompt	Source	Audio
P1	linux·cuda
P2	linux·cuda
P3	linux·cuda
P4	linux·cuda

MiraTTS 0.5B · Dec 2025 clones

Default voice

Prompt	Source	Audio
P1	linux·cuda
P2	linux·cuda
P3	linux·cuda
P4	linux·cuda

Cloning — chris_hemsworth

▶ Reference voice:

Prompt	Source	Audio
P1	win·cuda
P2	win·cuda
P3	win·cuda
P4	win·cuda

Miso TTS 8B 8.2B · May 2026 clones ⚠ artifacts ⟳ clone unstable

Default voice ⚠ artifacts

Prompt	Source	Audio
P1	win·cuda
P2	win·cuda
P3	win·cuda
P4	win·cuda

Cloning — chris_hemsworth ⟳ clone unstable

▶ Reference voice:

Prompt	Source	Audio
P1	win·cuda
P2	win·cuda
P3	win·cuda
P4	win·cuda

MOSS-TTS v1.0 8B · Feb 2026 clonesmultilingual

Cloning — chris_hemsworth

▶ Reference voice:

Prompt	Source	Audio
P1	win·cuda
P2	win·cuda
P3	win·cuda
P4	win·cuda
P5	win·cuda

MOSS-TTS v1.5 8B · May 2026 clonesmultilingual

Cloning — chris_hemsworth

▶ Reference voice:

Prompt	Source	Audio
P1	win·cuda
P2	win·cuda
P3	win·cuda
P4	win·cuda
P5	win·cuda

MOSS-TTS-Nano 100M · Apr 2026 clonesmultilingual

Cloning — chris_hemsworth

▶ Reference voice:

Prompt	Source	Audio
P1	win·cuda
P2	win·cuda
P3	win·cuda
P4	win·cuda
P5	win·cuda

NeuTTS Air 748M · Sep 2025 clones

Default voice

Prompt	Source	Audio
P1	win·cuda
P2	win·cuda
P3	win·cuda
P4	win·cuda

Cloning — chris_hemsworth

▶ Reference voice:

Prompt	Source	Audio
P1	win·cuda
P2	win·cuda
P3	win·cuda
P4	win·cuda

NeuTTS Nano 229M · Dec 2025 clones

Default voice

Prompt	Source	Audio
P1	win·cuda
P2	win·cuda
P3	win·cuda
P4	win·cuda
P5	win·cuda

Cloning — chris_hemsworth

▶ Reference voice:

Prompt	Source	Audio
P1	win·cuda
P2	win·cuda
P3	win·cuda
P4	win·cuda
P5	win·cuda

OmniVoice ~1B · Mar 2026 clonesmultilingual

Default voice

Prompt	Source	Audio
P1	win·cuda
P2	win·cuda
P3	win·cuda
P4	win·cuda
P5	win·cuda

Cloning — chris_hemsworth

▶ Reference voice:

Prompt	Source	Audio
P1	win·cuda
P2	win·cuda
P3	win·cuda
P4	win·cuda
P5	win·cuda

OpenVoice v2 ~100M · Apr 2024 clonesmultilingual

Cloning — chris_hemsworth

▶ Reference voice:

Prompt	Source	Audio
P1	win·cuda
P2	win·cuda
P3	win·cuda
P4	win·cuda
P5	win·cuda

Orpheus-TTS 3B 3.3B · Mar 2025 preset

Default voice

Prompt	Source	Audio
P1	linux·cuda
P2	linux·cuda
P3	linux·cuda
P4	linux·cuda

OuteTTS 1.0 1B 1B · Apr 2025 clonesmultilingual

Default voice

Prompt	Source	Audio
P1	win·cuda
P2	win·cuda
P3	win·cuda
P4	win·cuda
P5	win·cuda

Cloning — chris_hemsworth

▶ Reference voice:

Prompt	Source	Audio
P1	win·cuda
P2	win·cuda
P3	win·cuda
P4	win·cuda
P5	win·cuda

Parler-TTS Mini v1 878M · Jun 2024 preset

Default voice

Prompt	Source	Audio
P1	win·cuda
P2	win·cuda
P3	win·cuda
P4	win·cuda

Piper ~25MB · Jan 2023 presetmultilingual

Default voice

Prompt	Source	Audio
P1	win·cpu
P2	win·cpu
P3	win·cpu
P4	win·cpu
P5	win·cpu

Pocket-TTS 100M · Jan 2026 clones

Default voice

Prompt	Source	Audio
P1	win·cpu
P2	win·cpu
P3	win·cpu
P4	win·cpu
P5	win·cpu

Cloning — chris_hemsworth

▶ Reference voice:

Prompt	Source	Audio
P1	win·cpu
P2	win·cpu
P3	win·cpu
P4	win·cpu
P5	win·cpu

Qwen3-TTS 1.7B (CUDA-graph) 1.7B · Jan 2026 clonesmultilingual

Default voice

Prompt	Source	Audio
P1	win·cuda
P2	win·cuda
P3	win·cuda
P4	win·cuda
P5	win·cuda

Cloning — chris_hemsworth

▶ Reference voice:

Prompt	Source	Audio
P1	win·cuda
P2	win·cuda
P3	win·cuda
P4	win·cuda
P5	win·cuda

Qwen3-TTS 1.7B Base 1.7B · Jan 2026 clonesmultilingual

Default voice

Prompt	Source	Audio
P1	win·cuda
P2	win·cuda
P3	win·cuda
P4	win·cuda
P5	win·cuda

Scylla's Band ~103M · Jul 2026 presetmultilingual

Default voice

Prompt	Source	Audio
P1	win·cpu
P2	win·cpu
P3	win·cpu
P4	win·cpu

Sesame CSM-1B 1B · Mar 2025 clones

Default voice

Prompt	Source	Audio
P1	win·cuda
P2	win·cuda
P3	win·cuda
P4	win·cuda

Cloning — chris_hemsworth

▶ Reference voice:

Prompt	Source	Audio
P1	win·cuda
P2	win·cuda
P3	win·cuda
P4	win·cuda

Soprano 1.1 80M 80M · Jan 2026 preset

Default voice

Prompt	Source	Audio
P1	win·cuda
P2	win·cuda
P3	win·cuda
P4	win·cuda

Step-Audio-EditX 3B · Oct 2025 clones

Default voice

Prompt	Source	Audio
P1	linux·cuda
P2	linux·cuda
P3	linux·cuda
P4	linux·cuda

Cloning — chris_hemsworth

▶ Reference voice:

Prompt	Source	Audio
P1	linux·cuda
P2	linux·cuda
P3	linux·cuda
P4	linux·cuda

StyleTTS 2 ~148M · Jun 2023 clones

Default voice

Prompt	Source	Audio
P1	win·cuda
P2	win·cuda
P3	win·cuda
P4	win·cuda

Cloning — chris_hemsworth

▶ Reference voice:

Prompt	Source	Audio
P1	win·cuda
P2	win·cuda
P3	win·cuda
P4	win·cuda

Supertonic 3 99M · May 2026 presetmultilingual

Default voice

Prompt	Source	Audio
P1	win·cpu
P2	win·cpu
P3	win·cpu
P4	win·cpu
P5	win·cpu

VibeVoice 1.5B 1.5B · Aug 2025 clones

Cloning — chris_hemsworth

▶ Reference voice:

Prompt	Source	Audio
P1	win·cuda
P2	win·cuda
P3	win·cuda
P4	win·cuda

VibeVoice 7B 7B · Sep 2025 clones

Cloning — chris_hemsworth

▶ Reference voice:

Prompt	Source	Audio
P1	win·cuda
P2	win·cuda
P3	win·cuda
P4	win·cuda

VibeVoice Realtime 0.5B 0.5B · Dec 2025 preset

Default voice

Prompt	Source	Audio
P1	win·cuda
P2	win·cuda
P3	win·cuda
P4	win·cuda

VoxCPM2 2B 2B · Apr 2026 clonesmultilingual

Default voice

Prompt	Source	Audio
P1	win·cuda
P2	win·cuda
P3	win·cuda
P4	win·cuda
P5	win·cuda

Cloning — chris_hemsworth

▶ Reference voice:

Prompt	Source	Audio
P1	win·cuda
P2	win·cuda
P3	win·cuda
P4	win·cuda
P5	win·cuda

Voxtral 4B TTS 4B · Nov 2025 clonesmultilingual

Default voice

Prompt	Source	Audio
P1	mac·mps
P2	mac·mps
P3	mac·mps
P4	mac·mps
P5	mac·mps

WavTTS 0.67B 0.67B · May 2026 clonesmultilingual

Cloning — chris_hemsworth

▶ Reference voice:

Prompt	Source	Audio
P1	win·cuda
P2	win·cuda
P3	win·cuda
P4	win·cuda

ZipVoice 123M 123M · Jun 2025 clonesmultilingual

Cloning — chris_hemsworth

▶ Reference voice:

Prompt	Source	Audio
P1	win·cuda
P2	win·cuda
P3	win·cpu
P4	win·cuda
P5	win·cuda

Zonos v0.1 1.6B · Feb 2025 clonesmultilingual

Cloning — chris_hemsworth

▶ Reference voice:

Prompt	Source	Audio
P1	win·cuda
P2	win·cuda
P3	win·cuda
P4	win·cuda
P5	win·cuda

Zonos2 8B (MoE, ~900M active) · Jun 2026 clones

Cloning — chris_hemsworth

▶ Reference voice:

Prompt	Source	Audio
P1	linux·cuda
P2	linux·cuda
P3	linux·cuda
P4	linux·cuda