Multimodal ai systems architect (ai engineering)

Sydney

Hyphen Connect

Architect

Posted: 27 April

Offer description

Australia

We are seeking a talented Multimodal AI Systems Architect to develop and optimize AI systems that seamlessly integrate vision and audio models. This role focuses on enhancing our voice-to-voice interactions and multimodal retrieval capabilities, ensuring our systems are efficient and innovative.

Responsibilities

* Integrate vision encoders and audio-native models into core agent reasoning loops.
* Optimize streaming latency for voice-to-voice AI interactions.
* Architect multimodal RAG systems capable of retrieving insights from videos and PDFs.

Qualifications

* Experience with Whisper, CLIP, and multimodal LLM integration.
* Knowledge of streaming architectures and WebRTC.
* Expertise in cross-modal alignment.
#J-18808-Ljbffr

Send an application

Create a job alert

Save

Similar job

Technical solutions architect, risk products - australia

Sydney

BlueVoyant

Architect

Similar job

Lead data architect: microsoft fabric & enterprise insights

Sydney

NOVON

Architect

Similar job

E2e 5g core architect – strategic network leader

Sydney

Singtel Group

Architect