**Algorithmes d'apprentissage automatique (AA) non supervisés**
Les algorithmes d'AA non supervisés sont utilisés pour identifier des modèles et des structures dans les données non étiquetées (c'est-à -dire sans variables de réponse ou étiquettes cibles).
**Clustering**
Les algorithmes de clustering ont pour objectif de regrouper des points de données similaires en clusters. Parmi les méthodes de clustering les plus courantes figurent :
* **k-moyennes** : Partitionne les données en k clusters, où k est un nombre fixé.
* **Heirarchique** : Crée une hiérarchie de clusters, de l'agrégation de tous les points de données à la séparation en clusters individuels.
* **DBSCAN** (Density-Based Spatial Clustering of Applications with Noise) : Identifie les clusters en se basant sur la densité des points de données.
**Réduction de dimensionnalité**
Les algorithmes de réduction de dimensionnalité réduisent le nombre de caractéristiques dans les données tout en conservant les informations importantes. Parmi les méthodes les plus populaires figurent :
* **Analyse en composantes principales (ACP)** : Projette les données sur les axes principaux de variance, réduisant ainsi le nombre de caractéristiques nécessaires pour représenter la variation maximale.
* **Analyse des composantes indépendantes (ACI)** : Identifie des sous-ensembles de caractéristiques indépendants les uns des autres.
* **Projection basée sur une matrice non négative (NMF)** : Décompose les données en une combinaison de vecteurs non négatifs, permettant d'interpréter facilement les clusters.
**Applications des algorithmes d'AA non supervisés**
Les algorithmes d'AA non supervisés ont de nombreuses applications, notamment :
* **Segmentation de la clientèle** : Identification de groupes de clients ayant des comportements ou des préférences similaires.
* **Détection des anomalies** : Identification des points de données qui s'écartent des modèles normaux.
* **Analyse des sentiments** : Détermination de l'orientation positive ou négative du texte ou des données vocales.
* **Compression de données** : Réduction de la taille des données en supprimant les caractéristiques redondantes ou non informatives.
* **Visualisation des données** : Création de représentations visuelles des données de grande dimension pour faciliter l'identification de modèles et de structures.

