EMBA Assignment · Data Analysis · 2026

Cosa determina la marginalità di una commessa?

Un'analisi di regressione lineare multipla su 428 commesse di Ubics per capire quali leve influenzano davvero la redditività dei progetti digitali.

0Commesse analizzate
2Modelli confrontati
21%R² miglior modello
12Variabili significative
Scorri

01 · Il Contesto

Ubics e il problema da risolvere

Ubics è una digital agency del gruppo Var Group. Opera su progetti eterogenei — per dimensione, durata, tipologia — con un'unica leva di costo dominante: il personale.

Chi è Ubics

Digital agency parte di Var Group, leader ICT italiano. Claim: "from strategy to execution". Competenze: web, digital commerce, app custom, intranet, performance marketing.

L'eterogeneità del portafoglio

Commesse da poche centinaia di euro a ~500.000€. Durata: da 1 mese a oltre un anno. Mix di skills molto variabile.

La domanda di ricerca

Quali fattori influenzano la marginalità percentuale delle commesse, e in che misura? L'ipotesi di fondo: non solo la dimensione, ma soprattutto il mix di seniority e competenze del team.

La marginalità percentuale riflette l'efficienza con cui il team ha prodotto valore rispetto a quanto preventivato e venduto. Normalizzando la dimensione economica, permette confronti significativi tra commesse di scala molto diversa.

Perché la marginalità percentuale?

Anziché il margine assoluto: permette di confrontare commesse da 5.000€ e da 500.000€ sullo stesso piano, misurando l'efficienza indipendentemente dalla scala.

La fonte dati

Adobe Workfront — piattaforma di work management di Ubics. Integra gestione economica, ERP aziendale e timesheet operativi. Dati estratti via API in formato Excel.


02 · I Dati

Dataset, variabili costruite e perimetro di analisi

Commesse terminate tra gennaio 2024 e giugno 2026. Dal dataset grezzo al campione finale: 437 → 428 osservazioni.

0
Commesse nel campione iniziale
0
Escluse (outliers + errori)
0
Campione finale di analisi
0
Variabili costruite ex-novo

Variabili disponibili nel dataset

Dati identificativi e descrittivi

Nome progetto, cliente, program (progetto/maintenance/consulenza/ricorrente), tipologia contrattuale (forfait/monte ore/canone/T&M)

Dati economici

ricavo previsto, costo totale, margine assoluto, marginalità% — la variabile dipendente dell'analisi

Dati operativi

ore max preventivate, ore totali lavorate, durata in giorni, project owner

Dati sul mix del team

Distribuzione delle ore lavorate per costo orario, area funzionale e combinazione delle due. Sia in valore assoluto che come % sul totale ore.

Variabili costruite ex-novo

Costo medio ponderato per ora

Media ponderata sulle ore lavorate del costo orario delle risorse. Rappresenta realisticamente l'impatto del personale, pesando ogni risorsa per il suo contributo effettivo.

Σ (costo_orario_i × ore_i) / ore_totali

Seniority index

Valore tra 1 e 3: (3×ore_senior + 2×ore_middle + 1×ore_junior) / ore_totali. Classificazione: junior = 27.50€ o 35€/h, middle = 36.88€–52.50€/h, senior = 85€/h.

Tariffa media di vendita

Ricavo previsto / ore massime preventivate. Il "prezzo" implicito a cui Ubics ha venduto l'ora su quel progetto.

is_owner_senior (binaria)

Indica se il project owner è una figura senior. Permette di testare l'impatto della qualità della governance.

Intensity index

Ore totali lavorate / durata in giorni. Distingue progetti concentrati nel tempo da quelli distribuiti. Inserito nel modello come log(intensity_index).

Selezione del campione: chi è escluso e perché

Esclusi per tipologia contrattuale

Time & Materials — raramente usato, situazioni atipiche.
Contratto/Canone — progetti ricorrenti, struttura non comparabile.

Esclusi per program

Recurring — hosting, rifatturazione servizi: il mix team non è una leva rilevante per l'efficienza economica di queste commesse.

Inclusi: Projects, Maintenance, Consulting

Tutti con natura progettuale. Sia forfait che monte ore: in entrambi il team mix è una leva gestionale reale sulla marginalità.

8 outliers Mahalanobis

Esclusi dopo analisi delle distanze di Mahalanobis: errori di attribuzione dati e commesse strutturalmente non confrontabili con il portafoglio standard.


03 · L'Analisi Preliminare

Esplorare i dati prima del modello

Prima di costruire il modello, ogni variabile è stata esaminata nella sua distribuzione. Le decisioni di trasformazione e selezione emergono qui.

✓ Marginalità% — distribuzione ottimale

Distribuzione sostanzialmente simmetrica, vicina alla gaussiana. Nessuna trasformazione necessaria. Gli outlier negativi (<−50%) sono stati analizzati caso per caso: rappresentano progetti realmente andati male, con dinamiche riconoscibili. Mantenuti.

Variabili dimensionali — multicollinearità

Ricavo, ore, costi, durata: tutti altamente correlati (coefficienti ≈ 1). Sono proxy della stessa dimensione. Soluzione: una sola variabilelog(ricavo previsto) — ma nemmeno questa risulterà significativa nel modello finale.

Tariffa media di vendita — trasformazione log

Distribuzione asimmetrica → log molto efficace. Media e mediana coincidono a ln(55) = 4.007: la grande maggioranza delle commesse viene venduta attorno a ~55€/h come tariffa "standard".

Intensity index — trasformazione log

Log riduce ma non elimina l'asimmetria, per la natura del portafoglio (molte commesse con lavoro molto diluito nel tempo). Usato nel modello con questa asimmetria residua segnalata come limite.

La scelta su come rappresentare il mix del team

La questione centrale: costo medio ponderato, seniority index e % ore per categoria misurano tutti lo stesso fenomeno. Inserirli insieme produce multicollinearità. Come scegliere?

Solo area funzionale

✗ Non è una leva gestionale: è dettata dalle esigenze di progetto, non da ottimizzazione del margine.

Solo costo orario

✗ Non cattura differenze tra figure con stesso costo ma impatto diverso (es. M&S vs T&D).

Area × Costo orario ✓

✓ La combinazione è quella più rappresentativa delle scelte reali di allocazione del team.

Costo medio ponderato vs Seniority index

Altamente correlati (multicollinearità confermata). Preferito il costo medio ponderato: più preciso, basato su ore effettive, managerialmente interpretabile come "quanto costa mediamente un'ora su questo progetto".

La decisione finale

Costruire due modelli distinti e confrontarli: Modello 1 con costo medio ponderato; Modello 2 con % ore per categoria (area × costo). Il confronto guida la scelta.


04 · Metodologia e Modelli

Regressione lineare multipla: i due modelli

Approccio backward (automatico + manuale), soglia di significatività p < 5%. Confronto tra approccio sintetico e analitico per il team mix.

L'approccio metodologico

Marginalità percentuale della commessa — la stessa in tutti i modelli.

p-value < 5% — probabilità che l'effetto sia casuale inferiore al 5%.

Backward stepwise (auto + manuale) — rimozione iterativa della variabile meno significativa.

Dummy coding: Program → dummy per Projects e Consulting (riferimento: Maintenance). Tipologia → dummy Forfait (riferimento: Monte ore).
Modello 1

Costo medio ponderato

≈ 0.13
R²adj≈ 0.12
Variabili finali4
MulticollinearitàAssente (VIF≈1)
Costo medio ponderatoNon significativo (p≈0.32)

13% varianza spiegata

Modello 2

% Ore per categoria (area × costo)

≈ 0.21
R²adj≈ 0.187
Variabili finali4 comuni + 8 mix team
MulticollinearitàAssente (VIF≈1)
Variabili mix teamTutte p<0.01

21% varianza spiegata — +8pp rispetto al Modello 1

Il secondo modello spiega circa il 21% della varianza della marginalità — contro il 13% del primo. L'incremento di R²adjusted conferma che la composizione dettagliata del team cattura informazioni che il costo medio ponderato non riesce a cogliere.

La storia del Modello 1: perché il costo medio ponderato non entra

Modello completo: 8 variabili candidate
Program Consulting esce (campione insufficiente, p alto)
Scelta: rimuovere Projects o costo ponderato? → tenuto costo ponderato (var. di interesse)
Program Projects esce
Costo medio ponderato: p ≈ 0.32 → rimosso
Modello finale: 4 variabili significative

05 · I Risultati

Il modello finale e i suoi driver

Un nucleo di 4 variabili robusto in entrambi i modelli, più 8 variabili di composizione del team nel secondo. Ogni coefficiente racconta una storia managerialmente rilevante.

Il nucleo comune: 4 driver confermati in entrambi i modelli

📋
+ Effetto positivo

Tipologia a Forfait

I progetti a forfait generano margini percentuali migliori a parità di condizioni. Il forfait presuppone una stima accurata e incentiva l'efficienza nell'esecuzione. Attesta anche una forte capacità di execution: l'agenzia vince proprio dove si assume il rischio operativo.

👤
+ Effetto positivo

Seniority del Project Owner (is_owner_senior)

Un owner senior è associato a marginalità più alta. Il risultato più direttamente azionabile: la qualità della governance conta. Conferma la best practice già in uso di assegnare i progetti più importanti agli owner più esperti.

− Effetto negativo

Log(Intensity Index)

Più il progetto è concentrato nel tempo, peggiore tende a essere la marginalità. Picchi di utilizzo, coordinamento rapido, meno spazio per correggere errori in corso d'opera. Utile in pre-sales per valutare progetti con deadline stringenti.

💰
− Effetto negativo

Log(Tariffa media di vendita)

Controintuitivo: tariffe più alte → marginalità peggiore. Interpretazione: la tariffa non è una scelta di pricing ma un proxy della complessità del progetto. Progetti percepiti come complessi vengono prezzati di più, ma quella complessità poi erode i margini in esecuzione.

Beta standardizzati — Modello 1: nessun driver domina

Log(intensity_index)
−0.270
is_owner_senior
+0.170
Log(tariffa media vendita)
−0.169
Tipo forfait
+0.166
Il dato più rilevante non è la variabile in testa, ma la somiglianza dei valori. Gli altri tre driver hanno peso standardizzato quasi identico. La marginalità è il risultato di più leve combinate, non di un singolo driver prevalente.

Modello 2: la composizione del team in dettaglio

Ogni punto percentuale aggiuntivo di ore da quella categoria erode la marginalità di X punti percentuali. Tutte con segno negativo: aumentare la quota di qualsiasi categoria riduce la marginalità. Va letto in relazione alla baseline (intercetta ≈ 98).

VariabileCoeff. grezzoInterpretazione
% ore 85 M&S−2.35Figure senior M&S: costo di pre-sales non recuperabile nel ricavo
% ore 45 CSC−0.38Content Supply Chain: present sia in offerta che delivery
% ore 45–52.5 S&C−0.33Strategy & Consulting: spesso nella fase di offerta/gara
% ore 85 T&D−0.150Senior T&D: alto costo ma recuperabile nel valore tecnico prodotto
% ore 35–45 T&D−0.18T&D operative: lavoro direttamente recuperabile nel valore
% ore 35 PM−0.14PM junior: impatto più contenuto, delivery diretta
Paradosso T&D senior: le figure T&D a 85€/h hanno impatto unitario (−0.150) inferiore a figure di delivery junior. Il loro costo è in larga parte recuperabile nel ricavo: portano valore diretto al progetto, e i dati lo confermano.

Contributo di quella variabile alla varianza totale della marginalità sull'intero portafoglio. Non chi costa di più per unità, ma chi genera le differenze più grandi tra commessa e commessa.

% ore 45 CSC
−0.200
% ore 45 T&D
−0.197
% ore 85 M&S
−0.169
Perché CSC e T&D sono in testa? Non perché abbiano l'effetto più forte per unità, ma perché sono presenti con frequenza e proporzioni molto variabili su molte commesse. Quelle fluttuazioni generano la maggior parte della varianza nella marginalità.

Rischio concentrato e strutturale

% ore 85 M&S — impatto unitario enorme (−2.35) ma presenza rara. Sono il costo di acquisizione: coinvolti in pre-sales su gare complesse, il loro costo non è recuperabile nel ricavo della commessa. Non sono un problema: sono fondamentali per l'acquisizione, ma il modello li quantifica per la prima volta.

Driver quotidiano della variabilità

% ore 45 CSC e % ore 45 T&D — presenti in quasi tutti i progetti, con intensità variabile. Sono il costo di delivery: impatto unitario contenuto, ma generano la maggior parte delle differenze di marginalità perché sono ovunque.

La distinzione fondamentale: costo di acquisizione (pre-sales, irrecuperabile nel ricavo) vs costo di delivery (operativo, direttamente governabile con le scelte di staffing). Il modello non dice che le prime siano un problema, ma le quantifica per decisioni consapevoli.

Nota su % ore 45 CSC

Combina il coefficiente grezzo intermedio (−0.38) con il beta standardizzato più alto (−0.200). Riflette la natura ibrida: presente sia in fase di offerta (design interfacce nelle proposte di gara) sia nella delivery operativa. È la categoria con la maggiore influenza complessiva sulla marginalità.

Confronto visivo: coefficiente grezzo vs beta standardizzato

Le due classifiche non coincidono — e quella differenza è essa stessa un'informazione rilevante.

Validità statistica dei modelli

Assenza di multicollinearità

VIF prossimi a 1 in entrambi i modelli — frutto delle scelte metodologiche in fase di costruzione del set variabili.

Assenza di eteroschedasticità

Grafici dei residui: nessun pattern sistematico evidente. Solo outlier isolati. Le ipotesi del modello lineare sono rispettate.

R² = 21%: un limite noto

Il 79% della varianza rimane inspiegato. I modelli sono strumenti di indirizzo e comprensione, non di previsione puntuale di singole commesse.

Intervalli di confidenza al 95%: confermano la robustezza delle stime. Gli intervalli più ampi si osservano per % ore 85 M&S (range: −3.59 a −1.11), riflettendo il numero inferiore di commesse in cui queste figure sono presenti in modo significativo.

06 · Implicazioni Manageriali

Due modelli per due audience, e i limiti da tenere a mente

Modello 1 → Leadership

Strumento di governance strategica

Quattro variabili chiare, conversazioni di board. Indica che la marginalità migliora con owner senior, contratti forfait, e si deteriora con progetti troppo intensi o venduti a tariffe elevate. Utile per: politiche di pricing, criteri di assegnazione owner, preferenze contrattuali da proporre ai clienti.

Modello 2 → PM & Delivery Lead

Strumento operativo di staffing

La granularità del mix ore permette di ragionare sulle scelte di allocazione: quali figure, in quale fase, con quale peso. Offre una lente quantitativa su decisioni oggi prese per esperienza. Utile per: staffing consapevole, gestione del pre-sales, valutazione delle gare.

Il costo strutturale della pre-sales

Acquisire certi clienti richiede un investimento (commerciali, strategist, UX senior) che non sempre viene riassorbito nel ricavo della commessa. Il modello non dice che queste figure siano un problema — sono fondamentali — ma quantifica per la prima volta il loro impatto, offrendo una base per ragionare su struttura dei budget di pre-sales e su quali gare valga la pena partecipare.

Correlazione ≠ Causalità

Tariffa alta → margine peggiore?

No: la tariffa è un proxy di complessità, non una leva di pricing. Abbassare la tariffa non migliora la marginalità — ridurrebbe solo il ricavo su progetti già difficili.

Owner senior "causa" margini?

Non meccanicamente. È già una best practice assegnare i progetti difficili agli owner esperti. Il modello conferma che quella combinazione produce risultati migliori, non che basti nominare un senior su ogni commessa.

Ridurre le ore M&S senior?

Non necessariamente: sono fondamentali per acquisizione e relazione. Il modello quantifica il costo per decidere consapevolmente quando vale la pena, non per eliminare la categoria.

Limiti dell'analisi

Bias di selezione temporale

Solo commesse terminate nel periodo gen 2024 – giu 2026. Progetti ancora aperti non inclusi. Possibile bias se i progetti in corso hanno caratteristiche sistematicamente diverse.

Variabili non disponibili in Workfront

Non tracciate e non incluse: qualità della relazione con il cliente, stabilità dei requisiti, fornitori terzi, complessità operativa del cliente, attività non pianificate. La loro inclusione potrebbe migliorare significativamente l'R².

Possibili utilizzi e sviluppi futuri

Retrospettiva

Interpretare le commesse concluse, capire i pattern ricorrenti nei progetti più e meno efficienti. Banca dati di learning per il team.

Orientamento in pianificazione

In fase di offerta: quali elementi tendono a produrre risultati migliori? Quali gare e con quali condizioni vale la pena accettare?

Scoring predittivo in Workfront

La marginalità attesa potrebbe essere stimata già in fase di offerta. Identificazione preventiva delle commesse a rischio — prima che i problemi si manifestino.


Claude Sonnet 4.6 (Anthropic) — supporto redazionale: riformulazione, correzione sintattica e revisione stilistica del testo.

Claude Sonnet 4.6 via Claude Code — sviluppo di uno script Node.js per l'estrazione dei dati gestionali da Adobe Workfront via API e generazione del file Excel per l'analisi in JMP.

Gemini Flash 3.5 (Google) — assistente tecnico per domande operative sull'utilizzo di JMP (localizzazione comandi, configurazione interfaccia).

Contenuti, analisi e interpretazioni sono frutto del lavoro dell'autore. Gli strumenti AI hanno operato esclusivamente come supporto formale, tecnico e operativo.