Top
image bretage

A

Présentation

Ce projet
Implémentation de l'algorithme K-Means,

L'algorithme K-Means (ou K-moyennes en français) est un algorithme de partitionnement de données et d'optimisation combinatoire.
Cet algorithme est notamment utilisé dans le cadre de l'apprentissage non supervisé, ou l'on sépare des données en n groupes par "ressemblance".

Ce projet fut commencé dans le cadre de l'option Big Data lors de mon DUT informatique. Cependant je n'avais qu'à programmer une version "classique" de cet algorithme afin de m'exercer au langage SCALA.
J'ai donc programmé cet algorithme dans un langage qui m'est familier (JAVA) avant de le factoriser en SCALA.

C'est par la suite par curiosité que j'ai donc cherché s'il existait des variations de cet algorithme de façon à l'optimiser et à le rendre plus robuste en cas de données aberrantes.
J'ai ainsi découvert l'algorithme K-medoids, qui permet justement de rendre cet algorithme plus robuste en changeant la méthode de décision d'affectation des données à un cluster.

Le language de programmation utilisé est le JAVA ainsi que le SCALA.

Aperçu

Téléchargement

Vous pouvez télécharger gratuitement les sources de ce projet ci-dessous:

logo zip lien