Spark Avatar Picture Omni V2

API Tips

Image and Audio Requirements

Image formats: JPG (JPEG), PNG, JFIF and other common formats (JPG format recommended)

Image requirements: Less than 5 MB, less than 4096×4096

Input image: Input image should contain a single person with a large face proportion and frontal view for best results. Other types of images may produce poor results

Audio duration: Recommended less than 15 seconds to ensure generation quality. Audio that is too long may cause quality degradation

Authentication

authorization `string` required

All APIs require authentication via Bearer Token.

Get API Key:

Visit API Key Management Page to get your API Key.

Usage:

Add to request header:

Authorization: Bearer YOUR_API_KEY

Parameters

model `string` required

Model ID to use for the request

Value: spark_avatar_picture_omni_v2

image_url `string` required

Input image URL

audio_url `string` required

Audio URL for digital human animation

Polling

Since video generation takes time, you need to poll the task status after creation

The initial response returns the task ID and initial status. The actual generation results must be obtained through polling the task status endpoint

Response Format

error `object`

Error information. Only present when status is failed

code string

Error code

error_message string

Detailed error message

output `array`

Generation results. Only present when status is completed

content array

List of generated content

type string

Resource type

url string

Content URL

size integer

File size

jobId string

Remote job ID

usage `object`

Usage statistics. Only present when status is completed

cost string

Total cost in USD

discount number

Discount amount

input_tokens integer

Number of input tokens (fixed at 0)

output_tokens integer

Number of output tokens (fixed at 0)

total_tokens integer

Total number of tokens (actual comfyui_cost)

generated_videos integer

Number of generated videos

generated_images integer

Number of generated images

metadata `object`

Metadata information

Error Codes

Error Code	Description
003016001	Image URL missing
003016002	Audio URL missing
003016095	Internal generation error
003016096	Result parsing error
003016097	HTTP error response
003016098	Status check error
003016099	Task creation error

curl --location 'https://cloud.vtrix.ai/model/v1/generation' \ --header 'Content-Type: application/json' \ --header 'Authorization: Bearer YOUR_API_KEY' \ --data '{ "model": "spark_avatar_picture_omni_v2", "input": [ { "params": { "image_url": "https://example.com/input-image.jpg", "audio_url": "https://example.com/input-audio.mp3" } } ] }'

{ "id": "d5u5obte8783ap44qtj0", "created_at": 1769757744021, "status": "completed", "model": "spark_avatar_picture_omni_v2", "output": [ { "content": [ { "type": "video", "url": "https://example.com/generated-video.mp4", "size": 10485760, "jobId": "remote_job_id_12345" } ] } ], "usage": { "cost": "0.000500", "discount": 0, "input_tokens": 0, "output_tokens": 0, "total_tokens": 100, "generated_videos": 1 } }

Spark Avatar Picture Omni V2

API Tips

Image and Audio Requirements

Authentication

authorization `string` required

Parameters

model `string` required

image_url `string` required

audio_url `string` required

Polling

Response Format

error `object`

code `string`

error_message `string`

output `array`

content `array`

type `string`

url `string`

size `integer`

jobId `string`

usage `object`

cost `string`

discount `number`

input_tokens `integer`

output_tokens `integer`

total_tokens `integer`

generated_videos `integer`

generated_images `integer`

metadata `object`

Error Codes

API Tips

Image and Audio Requirements

Authentication

authorization string required

Parameters

model string required

image_url string required

audio_url string required

Polling

Response Format

error object

code string

error_message string

output array

content array

type string

url string

size integer

jobId string

usage object

cost string

discount number

input_tokens integer

output_tokens integer

total_tokens integer

generated_videos integer

generated_images integer

metadata object

Error Codes

authorization `string` required

model `string` required

image_url `string` required

audio_url `string` required

error `object`

code `string`

error_message `string`

output `array`

content `array`

type `string`

url `string`

size `integer`

jobId `string`

usage `object`

cost `string`

discount `number`

input_tokens `integer`

output_tokens `integer`

total_tokens `integer`

generated_videos `integer`

generated_images `integer`

metadata `object`