Fuzzy K-Means Clustering in Mahout



Questo blog fornisce un'introduzione al clustering Fuzzy K-Means in Apache Mahout.

Fuzzy K-Means è esattamente lo stesso algoritmo di K-means, che è una tecnica di clustering semplice e popolare. L'unica differenza è che, invece di assegnare un punto esclusivamente a un solo cluster, può avere una sorta di sfocatura o sovrapposizione tra due o più cluster. Di seguito sono riportati i punti chiave, che descrivono Fuzzy K-Means:





  • A differenza di K-Means, che cerca cluster rigidi, in cui ciascuno dei punti appartiene a un cluster, Fuzzy K-Means cerca i cluster più morbidi per la sovrapposizione.
  • Un singolo punto in un cluster morbido può appartenere a più di un cluster con un determinato valore di affinità verso ciascuno dei punti.
  • L'affinità è proporzionale alla distanza di quel punto dal centroide del cluster.
  • Simile a K-Means, Fuzzy K-Means funziona sugli oggetti che hanno la misura di distanza definita e possono essere rappresentati nel n- spazio vettoriale dimensionale.

Mappa Fuzzy K-Means Riduci flusso

Non c'è molta differenza tra il flusso MapReduce di K-Means e Fuzzy K-Means. L'implementazione di entrambi in Mahout è simile.

qtp vs selenio che è meglio

Di seguito sono riportati i file parametri essenziali per l'implementazione di Fuzzy K-Means:



  • È necessario un set di dati vettoriali per l'input.
  • Deve essere presente RandomSeedGenerator per eseguire il seeding dei k cluster iniziali.
  • Per misurare la distanza è richiesta la misura SquaredEuclideanDistanceMeasure.
  • Un valore elevato di soglia di convergenza, come –cd 1.0, se è stato utilizzato il valore al quadrato della misura della distanza
  • Un valore per maxIterations il valore predefinito è -x 10.
  • Il coefficiente di normalizzazione o il fattore di sfocatura, con un valore maggiore di -m 1.0

Hai domande per noi? Menzionateli nella sezione commenti e vi risponderemo.

come invertire un numero intero in python

Post correlati



c ++ come ordinare un array

Apprendimento supervisionato in Apache Mahout