2.1 Primi esempi con R
Prima di passare a Radiant, riteniamo utile presentare alcuni comandi di R, ovvero table()
, pie()
e boxplot()
, che consentono di svolgere delle semplici analisi descrittive.
La funzione table()
consente di creare una distribuzione di frequenze per una singola variabile qualitativa/categorica o numerica discreta. A titolo d’esempio, consideriamo la variabile MBA
, la quale indica quali dei CEO inclusi nel data frame forbes94
possedevano un titolo di MBA nel 1994. Il codice seguente costruisce la distribuzione di frequenze della variabile MBA
:
> table(forbes94$MBA)
0 1
589 211
L’output generato da table()
è di fatto un vettore i cui elementi sono denominati con le categorie osservate di MBA
.
E’ possibile rappresentare graficamente una distribuzione di frequenze per una variabile categorica con un diagramma a torta, disponibile in R tramite la funzione pie()
:
> pie(table(forbes94$MBA), main = "Diagramma a torta per MBA")
L’argomento opzionale main
, che ha valore di default ""
(ovvero una stringa di testo vuota), serve per aggiungere un titolo al grafico.
Come ultimo esempio di analisi descrittive svolte direttamente in R presentiamo la funzione boxplot()
, che consente di produrre un box-plot per una singola variabile numerica. Per esempio, il box-plot della variabile Salary
si ottiene come segue:
> boxplot(forbes94$Salary)
Come tutte le funzioni che producono un output grafico, anche boxplot()
contiene una lunga serie di argomenti, tra cui troviamo main
, xlab
e ylab
, i quali servono rispettivamente per aggiungere un titolo, la descrizione dell’asse orizzontale e quella dell’asse verticale. Un argomento (logico) specifico di boxplot()
è horizontal
, con il quale possiamo indicare se produrre il box-plot in orizzontale (TRUE
) oppure in verticale (FALSE
, valore di default):
> boxplot(forbes94$Salary, main = "Box-plot di Salary", xlab = "Salary (in $)",
+ horizontal = TRUE)