Commandes R : aperçu des commandes R de base
Les commandes R sont la base de l’analyse de données et de la modélisation statistique dans l’environnement R. Elles offrent les outils et la flexibilité nécessaires pour comprendre les données, détecter des schémas et prendre des décisions avisées.
Commandes R : qu’est-ce que c’est ?
Les commandes R (ou Commandes R en anglais) sont des instructions utilisées en programmation R pour exécuter des tâches spécifiques ou initier des tâches dans l’environnement R. Ces commandes permettent d’analyser des données, d’exécuter des calculs statistiques ou de créer des visualisations. Les commandes R peuvent être saisies et traitées dans la ligne de commande R ou dans les scripts R. Il est important de distinguer les commandes des fonctions R.
Les fonctions R sont des blocs de code définis et désignés sous R, qui exécutent des tâches spécifiques. Elles peuvent inclure l’utilisation d’opérateurs R et de données R afin d’accepter des arguments ou d’afficher des valeurs de retour. Cela signifie que les fonctions peuvent enregistrer, traiter et retourner des données qui sont associées à différents types de données R.
Avec un hébergement Web de IONOS, vous bénéficiez d’au moins 50 Go de mémoire libre et de serveurs puissants à disponibilité élevée, qui veillent à ce que votre site Web soit toujours en ligne et qu’il charge rapidement. En outre, vous disposez d’un domaine gratuit et d’un certificat SSL Wildcard afin de garantir la sécurité de votre site Web.
Commandes R : liste des différentes commandes
La liste des commandes R suivante vous donne un aperçu des différents domaines d’application en programmation R. Selon vos projets et exigences spécifiques, vous pouvez sélectionner et combiner les commandes R appropriées.
Manipulation et traitement des données
-
read.csv()
: lecture des données d’un fichier CSV -
data.frame()
: création d’une trame de données -
subset()
: filtrage des données sur la base de conditions spécifiques -
merge()
: fusion de données provenant de trames de données différentes -
aggregate()
: agrégation de données sur la base de critères spécifiques -
transform()
: création de nouvelles variables dans une trame de données -
sort()
: tri de vecteurs ou de trames de données -
unique()
: identification de valeurs uniques dans un vecteur ou une colonne
Visualisation des données
-
plot()
: création de diagrammes de dispersion et d’autres types de diagrammes basiques -
hist()
: création d’histogrammes -
barplot()
: création de diagrammes à barres -
boxplot()
: création de boîtes à moustache -
ggplot2::ggplot()
: pour des visualisations plus exigeantes et personnalisables avec le paquet ggplot2
Analyses statistiques
-
summary()
: préparation d’un regroupement de données, y compris les chiffres clés statistiques -
lm()
: exécution de régressions linaires -
t.test()
: exécution de tests T pour tester des hypothèses -
cor()
: calcul des coefficients de corrélation entre les variables -
anova()
: exécution d’analyses de la variance (ANOVA) -
chi-sq.test()
: pour les tests du chi carré
Traitement des données
-
ifelse()
: pour les évaluations de la condition et les expressions conditionnelles -
apply()
: application d’une fonction à des matrices ou trames de données -
dplyr::filter()
: filtrage des données dans une trame de données avec le paquet dplyr -
dplyr::mutate()
: création de nouvelles variables dans les trames de données avec le paquet dplyr -
lapply()
,sapply()
,mapply()
: pour l’application de fonctions à des listes ou vecteurs
Importation et exportation des données
-
readRDS()
,saveRDS()
: lecture et enregistrement des objets de données R -
write.csv()
,read.table()
: exportation et importation des données en différents formats
Diagrammes et graphiques statistiques
-
qqnorm()
,qqline()
: pour la création de diagrammes quantile-quantile -
plot()
,acf()
: représentation de diagrammes d’autocorrélation -
density()
: représentation de fonctions de densité et d’histogrammes -
heatmap()
: création de cartes de densité
Commandes R : exemples d’utilisation
Les exemples de code suivants illustrent l’utilisation des principales commandes R dans divers domaines d’application. Selon vos exigences en matière de données et d’analyses, vous pouvez adapter et développer ces commandes.
Lecture des données d’un fichier CSV
data <- read.csv("donnees.csv")
RRead.csv()
est une commande permettant de lire les données présentes dans un fichier CSV, en R. Dans notre exemple, les données lues sont enregistrées dans la variable data
. Cette commande est utile pour importer des données externes en R et pour mettre à disposition des analyses.
Création d’un diagramme de dispersion
plot(data$X, data$Y, main="DiagrammeDispersion")
RPlot() est une commande R permettant de créer des diagrammes et des graphiques en R. Dans notre exemple, un diagramme de dispersion est créé afin de représenter la relation entre les variables X
et Y
de la trame de données data
. L’argument main
définit le titre du diagramme.
Exécution d’une régression linéaire
regression_model <- lm(Y ~ X, data=data)
RDans cet exemple, nous exécutons une régression linéaire afin de modéliser la relation entre les variables X
et Y
dans la trame de données data
. La commande lm()
sert à calculer une régression linéaire en R. Le résultat de la régression est enregistré dans la variable regression_model
et peut être utilisé pour d’autres analyses.
Filtrage des données avec le paquet dplyr
filtered_data <- dplyr::filter(data, column > 10)
RLa commande dplyr::filter()
provient du paquet dplyr et sera utilisée pour la manipulation des données. Le paquet dplyr fournit des fonctions puissantes pour le filtrage des données. Nous obtenons la variable filtered_data
en sélectionnant les lignes de la trame de données data
pour lesquelles la valeur de la colonne column
est supérieure à 10.
Création de diagrammes quantile-quantile
qqnorm(data$Variable)
qqline(data$Variable)
RVous pouvez utiliser qqnorm()
pour représenter un diagramme quantile-quantile en R. Dans cet exemple, un diagramme quantile-quantile est représenté pour la variable Variable
de data
. qqline()
ajoute une ligne de référence afin de comparer la répartition avec une répartition normale.
Nous recommandons à tous les débutants de consulter le tutoriel de présentation de la programmation en R. Vous y trouverez de nombreux conseils et les connaissances de base nécessaires pour progresser avec le langage de programmation en R. D’autres conseils et bases sont disponibles dans notre article « Apprendre la programmation : principes de base » du Digital Guide.