Gemini 3.1 Flash TTS Preview

API Notes

gemini_3_1_flash_tts_preview returns generated audio as an audio/wav file URL in the task result

gemini_3_1_flash_tts_preview usage is reported with input_text_tokens and output_audio_tokens when token usage is available

Authentication

authorization `string` required

All APIs require authentication via Bearer Token.

Get API Key:

Visit API Key Management Page to get your API Key.

Usage:

Add to request header:

Authorization: Bearer YOUR_API_KEY

Parameters

model `string` required

Model ID to use for the request

Value: gemini_3_1_flash_tts_preview

input `array` required

Input array for the unified generation request

params object required

Text-to-speech parameters

text string required

Text to convert to speech. prompt is also accepted as a compatibility alias, but text is recommended

voice_name string

Prebuilt voice name for speech synthesis

Default: Kore

Polling

Since audio generation takes time, you need to poll the task status after creation

The initial response returns the task ID and initial status. The actual generated audio URL must be obtained through the task status endpoint

Response Format

error `object`

Error information. Only present when status is failed

code integer

Error code

error_message string

Detailed error message

output `array`

Generation results. Only present when status is completed

content array

List of generated audio content

type string

Resource type, fixed as audio

mime_type string

Audio MIME type, fixed as audio/wav

url string

Generated audio file URL

usage `object`

Usage statistics. Only present when status is completed

extra_info object

Normalized token usage details

input_text_tokens integer

Number of input text tokens

output_audio_tokens integer

Number of generated audio tokens

total_tokens integer

Total token count

metadata `object`

Metadata information

curl --location 'https://cloud.vtrix.ai/model/v1/generation' \ --header 'Content-Type: application/json' \ --header 'Authorization: Bearer YOUR_API_KEY' \ --data '{ "model": "gemini_3_1_flash_tts_preview", "input": [ { "params": { "text": "Say cheerfully: Have a wonderful day!", "voice_name": "Kore" } } ] }'

{ "id": "mmsu_d8cisaqtdq7s72u40b60", "created_at": 1780035116020, "status": "completed", "model": "gemini_3_1_flash_tts_preview", "output": [ { "content": [ { "type": "audio", "mime_type": "audio/wav", "url": "https://example.com/generated-audio.wav" } ] } ], "usage": { "extra_info": { "input_text_tokens": 8, "output_audio_tokens": 59, "total_tokens": 67 } }, "metadata": {} }

Gemini 3.1 Flash TTS Preview

API Notes

Authentication

authorization `string` required

Parameters

model `string` required

input `array` required

params `object` required

text `string` required

voice_name `string`

Polling

Response Format

error `object`

code `integer`

error_message `string`

output `array`

content `array`

type `string`

mime_type `string`

url `string`

usage `object`

extra_info `object`

input_text_tokens `integer`

output_audio_tokens `integer`

total_tokens `integer`

metadata `object`

API Notes

Authentication

authorization string required

Parameters

model string required

input array required

params object required

text string required

voice_name string

Polling

Response Format

error object

code integer

error_message string

output array

content array

type string

mime_type string

url string

usage object

extra_info object

input_text_tokens integer

output_audio_tokens integer

total_tokens integer

metadata object

authorization `string` required

model `string` required

input `array` required

params `object` required

text `string` required

voice_name `string`

error `object`

code `integer`

error_message `string`

output `array`

content `array`

type `string`

mime_type `string`

url `string`

usage `object`

extra_info `object`

input_text_tokens `integer`

output_audio_tokens `integer`

total_tokens `integer`

metadata `object`