Full Stack Engineer (AI/LLM FOCUS) - Milano (zona Lorenteggio)
📍 Posizione: Milano (zona Lorenteggio)
🏭 Settore: Edilizia
📎 Riferimento: 23871.02.MB
Per una società nostra cliente, startup italiana fondata nel 2025, cresciuta rapidamente fino a 30 persone e finanziata con 3,2 milioni di euro per innovare il settore delle costruzioni, con l’obiettivo di diventare la piattaforma digitale di riferimento in Italia ed Europa., siamo alla ricerca di un\una:
FULL STACK ENGINEER (AI/LLM FOCUS)
Il candidato avrà le seguenti responsabilità:
Ideare e costruire workflow agentici: progettazione dei prompt, coordinamento degli strumenti, ragionamento multi-step e messa in produzione.
Sviluppare pipeline di ricerca RAG e semantica sfruttando database vettoriali e modelli di embedding per fornire contesto pertinente agli agenti di IA.
Creare pipeline di document processing che convertano file non strutturati (fatture, report, moduli) in dati strutturati all’interno di database.
Implementare sistemi di osservabilità e valutazione: tracciamento, monitoraggio degli esperimenti e analisi automatizzata della qualità degli output dei modelli LLM.
Migliorare le strategie di gestione del contesto degli agenti: suddivisione dei contenuti, ricerca ibrida e ri-ranking per aumentare la qualità delle risposte.
Operare su tutto lo stack tecnologico (React/Next.js, tRPC, PostgreSQL, funzioni serverless) quando necessario per abilitare funzionalità basate su IA.
Il candidato avrà i seguenti requisiti:
Esperienza nello sviluppo di applicazioni in produzione basate su LLM: agenti intelligenti, utilizzo di strumenti esterni e generazione di output strutturati.
Esperienza pratica con sistemi RAG: embedding, database vettoriali, ricerca ibrida e strategie di suddivisione dei contenuti (chunking).
Conoscenza di TypeScript o forte motivazione ad apprenderlo: l’intero stack tecnologico è sviluppato in questo linguaggio.
Esperienza con framework di orchestrazione per AI (come LangChain, Mastra, CrewAI o soluzioni analoghe).
Ottima padronanza di SQL e database relazionali: capacità di scrivere query complesse e ottimizzare pipeline di dati.
Conoscenza delle tecniche di prompt engineering: few-shot prompting, chain-of-thought e strutturazione avanzata degli output.
Requisiti preferenziali:
Esperienza in MLOps: deploy di modelli su infrastrutture GPU serverless, CI/CD per sistemi AI e monitoraggio di modelli e agenti in produzione.
Conoscenza di MCP (Model Context Protocol) o standard simili per l’integrazione e la distribuzione di strumenti.
Esperienza nella realizzazione di agenti conversazionali multi-turno con gestione della memoria e dello stato.
Orario di lavoro: Full Time
Sede di lavoro: Milano (zona Lorenteggio)
L’inquadramento sarà commisurato al grado di autonomia acquisito
La ricerca si intende rivolta ad ambo i sessi (L. 125/91, art. 4 comma 3)