Full Stack Engineer (AI/LLM FOCUS) - Milano (zona Lorenteggio)

📍 Posizione: Milano (zona Lorenteggio)

🏭 Settore: Edilizia

📎 Riferimento: 23871.02.MB


Per una società nostra cliente, startup italiana fondata nel 2025, cresciuta rapidamente fino a 30 persone e finanziata con 3,2 milioni di euro per innovare il settore delle costruzioni, con l’obiettivo di diventare la piattaforma digitale di riferimento in Italia ed Europa., siamo alla ricerca di un\una:

FULL STACK ENGINEER (AI/LLM FOCUS)

Il candidato avrà le seguenti responsabilità:

  • Ideare e costruire workflow agentici: progettazione dei prompt, coordinamento degli strumenti, ragionamento multi-step e messa in produzione.

  • Sviluppare pipeline di ricerca RAG e semantica sfruttando database vettoriali e modelli di embedding per fornire contesto pertinente agli agenti di IA.

  • Creare pipeline di document processing che convertano file non strutturati (fatture, report, moduli) in dati strutturati all’interno di database.

  • Implementare sistemi di osservabilità e valutazione: tracciamento, monitoraggio degli esperimenti e analisi automatizzata della qualità degli output dei modelli LLM.

  • Migliorare le strategie di gestione del contesto degli agenti: suddivisione dei contenuti, ricerca ibrida e ri-ranking per aumentare la qualità delle risposte.

  • Operare su tutto lo stack tecnologico (React/Next.js, tRPC, PostgreSQL, funzioni serverless) quando necessario per abilitare funzionalità basate su IA.

Il candidato avrà i seguenti requisiti:

  • Esperienza nello sviluppo di applicazioni in produzione basate su LLM: agenti intelligenti, utilizzo di strumenti esterni e generazione di output strutturati.

  • Esperienza pratica con sistemi RAG: embedding, database vettoriali, ricerca ibrida e strategie di suddivisione dei contenuti (chunking).

  • Conoscenza di TypeScript o forte motivazione ad apprenderlo: l’intero stack tecnologico è sviluppato in questo linguaggio.

  • Esperienza con framework di orchestrazione per AI (come LangChain, Mastra, CrewAI o soluzioni analoghe).

  • Ottima padronanza di SQL e database relazionali: capacità di scrivere query complesse e ottimizzare pipeline di dati.

  • Conoscenza delle tecniche di prompt engineering: few-shot prompting, chain-of-thought e strutturazione avanzata degli output.

Requisiti preferenziali:

  • Esperienza in MLOps: deploy di modelli su infrastrutture GPU serverless, CI/CD per sistemi AI e monitoraggio di modelli e agenti in produzione.

  • Conoscenza di MCP (Model Context Protocol) o standard simili per l’integrazione e la distribuzione di strumenti.

  • Esperienza nella realizzazione di agenti conversazionali multi-turno con gestione della memoria e dello stato.

Orario di lavoro: Full Time

Sede di lavoro: Milano (zona Lorenteggio)

L’inquadramento sarà commisurato al grado di autonomia acquisito

La ricerca si intende rivolta ad ambo i sessi (L. 125/91, art. 4 comma 3)