2.1 Primi esempi con R

Prima di passare a Radiant, riteniamo utile presentare alcuni comandi di R, ovvero table(), pie() e boxplot(), che consentono di svolgere delle semplici analisi descrittive.

La funzione table() consente di creare una distribuzione di frequenze per una singola variabile qualitativa/categorica o numerica discreta. A titolo d’esempio, consideriamo la variabile MBA, la quale indica quali dei CEO inclusi nel data frame forbes94 possedevano un titolo di MBA nel 1994. Il codice seguente costruisce la distribuzione di frequenze della variabile MBA:

> table(forbes94$MBA)

  0   1 
589 211 

L’output generato da table() è di fatto un vettore i cui elementi sono denominati con le categorie osservate di MBA.

E’ possibile rappresentare graficamente una distribuzione di frequenze per una variabile categorica con un diagramma a torta, disponibile in R tramite la funzione pie():

> pie(table(forbes94$MBA), main = "Diagramma a torta per MBA")
Esempio di diagramma a torta con R.

Figura 2.1: Esempio di diagramma a torta con R.

L’argomento opzionale main, che ha valore di default "" (ovvero una stringa di testo vuota), serve per aggiungere un titolo al grafico.

Come ultimo esempio di analisi descrittive svolte direttamente in R presentiamo la funzione boxplot(), che consente di produrre un box-plot per una singola variabile numerica. Per esempio, il box-plot della variabile Salary si ottiene come segue:

> boxplot(forbes94$Salary)
Esempio di box-plot con R.

Figura 2.2: Esempio di box-plot con R.

Come tutte le funzioni che producono un output grafico, anche boxplot() contiene una lunga serie di argomenti, tra cui troviamo main, xlab e ylab, i quali servono rispettivamente per aggiungere un titolo, la descrizione dell’asse orizzontale e quella dell’asse verticale. Un argomento (logico) specifico di boxplot() è horizontal, con il quale possiamo indicare se produrre il box-plot in orizzontale (TRUE) oppure in verticale (FALSE, valore di default):

> boxplot(forbes94$Salary, main = "Box-plot di Salary", xlab = "Salary (in $)",
+   horizontal = TRUE)
Esempio di box-plot con R.

Figura 2.3: Esempio di box-plot con R.