Agrupació

Veure Aplicació »

agrupacio3

L'AGRUPACIÓ busca característiques comuns entre les dades i les classifica en categories (també anomenades clústers). Es tracta de descobrir grups i estructures en les dades que d'alguna manera són similars. També es coneix amb el nom d'aprenentatge no supervisat.

 

Les dades que es tracten en la Mineria de dades són llistes de casos que tenen diversos atributs. Per exemple, un objecte (cas) té varis atributs (color, forma, mida, etc.). L'agrupació de les dades consisteix a trobar aquell atribut o atributs que són més útils per a classificar els casos en categories.

Agrupar dades és senzill quan s'han de tenir en compte pocs atributs (menys de 5) i es pot fer manualment. Però quan el nombre d'atributs és molt extens (més de 20) la tasca esdevé molt feixuga. El nostre cervell no pot manejar tanta informació i es necessita l'ajuda d'algoritmes i ordinadors per a trobar agrupacions. Un cop s'ha automatitzat aquest procés, el volum de dades que es pot tractar pot ser immens. Això permet classificar les nostres dades molt ràpidament.

 

MINTRADA disposa dels procediments per a realitzar aquesta tasca d'AGRUPACIÓ de manera ràpida, automàtica i eficient.

 

Alguns exemples:

  • Gravetat d'una malaltia. A partir dels atributs d'una malaltia d'un pacient (símptomes, afectació a l'estat d'ànim, incomoditats, cronicitat, letalitat, etc.) es poden classificar les malalties dels pacients en diverses categories (greu, lleu, crític, etc.).
  • Taxonomia. La taxonomia s'encarrega de classificacar (sobretot animals i plantes). La taxonomia es pot automatitzar per tal de buscar categories es diversos camps de la ciència: infeccions de cultius, eficàcia de fàrmacs, resistència de materials, etc.
  • Gamma de productes. A partir dels diversos atributs que té un producte (preu, disseny, despeses de manteniment, temps de vida, etc.) es poden buscar agrupacions de productes amb caractersítiques similars en funció de la seva gamma (gamma alta, baixa, mitja, etc.).
  • Tipus de clients. A partir dels atributs dels clients (freqüència de compra, volum de compra, grau de satisfacció, influència sobre altres clients, etc.) es determinen categories en funció de si se'ls ha de categoritzar com a VIPs, bons clients, mals clients, etc.


Aplicació 

Aquesta aplicació classifica casos de manera automàtica en el nombre de categories que se li demana. L'aplicació utilitza l'algoritme de clusterització anomenat k-means clustering. L'algoritme agrupa els casos per proximitat d'una manera ràpida i efectiva. En aquesta aplicació es poden agrupar casos que només continguin 2 atributs. Els 2 atributs es poden representar mitjançant punts en un pla. Si el primer atribut és més gran, se situa més a la dreta i si és més petit, més a l'esquerra. Si el segon atribut és més gran, si situa més amunt i si és més petit, més avall. La representació gràfica de més de 3 atributs no és possible i per això resulta tant difícil agrupar les dades quan el nombre d'atributs és tan gran.

Funcionament

  1. Cliqueu sobre el pla per afegir punts que simbolitzen casos.
  2. Seleccioneu el nombre de grups que voleu formar clicant els botons +/-.
  3. Cliqueu Classificar per obtenir les agrupacions de punts. Cada categoria quedarà pintada amb un color diferent.
  4. Torneu a clicar sobre el pla per afegir més punts o cliqueu Netejar per a esborrar-los.

 

NOTA LEGAL: Aquesta aplicació és un exemple de mostra i s'ofereix sense cap garantia. MINTRADA no es responsabilitza de l'ús inadequat i de les seves conseqüències. Utilitzeu-la sota la vostra responsabilitat. Contacteu amb nosaltres per a un servei garantit.

+Solucions »   Contactar »

Solucions per a la Mineria de Dades