Esercizio n. 1. Sul sito EUROSTAT si segua il link "Innovation and Research". Si accede ai dati annuali delle nazioni europee relativi a voci quali "Spending on human resources", "Patent applications...", ecc. Considerando l'insieme di queste voci, l'insieme delle nazioni, e l'insieme degli anni, è come possedere una tabella a tre entrate. Per poter applicare metodi tipo PCA (eventualmente FA) e regressione, bisogna ridursi ad una matrice a due entrate, cosa che si può fare a scelta in vari modi. Il più banale è fissare l'attenzione su un anno specifico, es. 2003; un altro è mediare i valori su un range di anni, es. su 2000-2004; in entrambi questi casi, restano come entrate le voci e le nazioni. Supponiamo allora (a scelta di chi svolge l'esercizio) di aver fissato ad esempio l'anno e di considerare la tabella a due entrate, costruibile su un foglio Excel, in cui le righe sono le diverse nazioni, mentre le colonne sono alcune delle voci sopra menzionate (anche tutte). C'è un problema tecnico: mancano alcuni dati. Per questo forse la soluzione migliore non è quella di fissare un anno ma di mediare su un po' di anni. Se permane il problema, si suggerisce di inserire arbitrariamente un valore preso interpolando i valori vicini di quella nazione. Nota: liberamente, si scelga se esaminare solo poche voci, es. 5, oppure tutte; questa scelta influisce in qualche modo sul seguito dell'esercizio; entrambe le scelte sono molto interessanti. Arrivati a questo punto abbiamo una tabella simile a IB (oppure con molte variabili, comunque simile concettualmente). La si salvi in formato .txt e la si importi in R. Si eseguano su questa tabella un po' di analisi, a scelta, ispirate a quanto fatto nel corso per la tabella IB. In particolare, può essere interessante: 1) capire somiglianze e differenze tra nazioni europee; 2) capire la dimensionalità del problema "Innovation and Research", i legami tra le variabili, la presenza di variabili (nascoste, globali) che spieghino la moltitudine di variabili (voci) misurate.