FUZZY K-MEANS CLUSTERING IN MAHOUT

Questo blog fornisce un'introduzione al clustering Fuzzy K-Means in Apache Mahout.

Fuzzy K-Means è esattamente lo stesso algoritmo di K-means, che è una tecnica di clustering semplice e popolare. L'unica differenza è che, invece di assegnare un punto esclusivamente a un solo cluster, può avere una sorta di sfocatura o sovrapposizione tra due o più cluster. Di seguito sono riportati i punti chiave, che descrivono Fuzzy K-Means:

A differenza di K-Means, che cerca cluster rigidi, in cui ciascuno dei punti appartiene a un cluster, Fuzzy K-Means cerca i cluster più morbidi per la sovrapposizione.
Un singolo punto in un cluster morbido può appartenere a più di un cluster con un determinato valore di affinità verso ciascuno dei punti.
L'affinità è proporzionale alla distanza di quel punto dal centroide del cluster.
Simile a K-Means, Fuzzy K-Means funziona sugli oggetti che hanno la misura di distanza definita e possono essere rappresentati nel n- spazio vettoriale dimensionale.

Mappa Fuzzy K-Means Riduci flusso

Non c'è molta differenza tra il flusso MapReduce di K-Means e Fuzzy K-Means. L'implementazione di entrambi in Mahout è simile.

qtp vs selenio che è meglio

Di seguito sono riportati i file parametri essenziali per l'implementazione di Fuzzy K-Means:

È necessario un set di dati vettoriali per l'input.
Deve essere presente RandomSeedGenerator per eseguire il seeding dei k cluster iniziali.
Per misurare la distanza è richiesta la misura SquaredEuclideanDistanceMeasure.
Un valore elevato di soglia di convergenza, come –cd 1.0, se è stato utilizzato il valore al quadrato della misura della distanza
Un valore per maxIterations il valore predefinito è -x 10.
Il coefficiente di normalizzazione o il fattore di sfocatura, con un valore maggiore di -m 1.0

Hai domande per noi? Menzionateli nella sezione commenti e vi risponderemo.

come invertire un numero intero in python

Post correlati

c ++ come ordinare un array

Apprendimento supervisionato in Apache Mahout

Questo blog fornisce un'introduzione al clustering Fuzzy K-Means in Apache Mahout.

Mappa Fuzzy K-Means Riduci flusso

Categorie

Popular Articles

Come implementare diversi tipi di elenchi in HTML?

Stipendio AWS: quanto guadagna un professionista AWS?

Cosa sono le immagini HTML e come modificare la tua pagina web?

Come implementare Mysql_fetch_array in PHP

Cos'è l'aggregazione in Java e perché ne hai bisogno?

I migliori strumenti di marketing digitale che dovresti conoscere

Taglio delle stringhe in Python: tutto ciò che devi sapere

Le migliori strutture dati e algoritmi in Java che devi conoscere

Cos'è AngularJS Bootstrap e come usarlo praticamente?

Come invertire un numero in Python?

Installazione e visualizzazioni del dashboard Kubernetes

Tutto quello che devi sapere sulle annotazioni TestNG in selenio