Anais > Edições Anteriores > Anais do X WCF 2014 > Algoritmos Sequenciais de Agrupamento e Estratégias de Refinamento Associadas

Algoritmos Sequenciais de Agrupamento e Estratégias de Refinamento Associadas

Autores: Eduardo Machado Real, Maria do Carmo Nicoletti

Este trabalho apresenta uma versão condensada e parcial dos principais resultados obtidos durante a realização de uma pesquisa em nivel de mestrado acadêmico (descrita na íntegra em [Real 2014]). O trabalho de pesquisa investigou (1) algoritmos de Aprendizado de Máquina (AM), particularmente aqueles relacionados à aprendizado de máquina não supervisionado caracterizados como algoritmos de agrupamento; (2) técnicas de pré-processamento de dados e (3) dois índices de validação. Dentre os muitos algoritmos de agrupamento disponíveis na literatura, três deles, identificados como algoritmos sequencias de agrupamento, foram escolhidos. Algoritmos sequencias são razoavelmente simples, produzem um único agrupamento e, via de regra, fazem poucas 'varreduras' dos dados iniciais. Esse artigo descreve apenas o trabalho realizado relacionado aos três algoritmos e a dois outros, caracterizados como possíveis estratégias de refinamento de agrupamentos obtidos.
Como estabelecido em inúmeras publicações acadêmicas (ver [Theodoridis e Koutroumbas 2009], [Jain et. al. 1999], [Han e Kamber 2006]), o principal objetivo de um algoritmo de agrupamento é o de organizar um conjunto de dados em grupos, geralmente utilizando como critério a similaridade entre os dados. O conjunto inicial de dados organizado em grupos é o que, nesse trabalho, é identificado como agrupamento.
Tipicamente agrupamentos são usados para categorizar (cada grupo do agrupamento pode ser abordado como uma categoria ou classe), dados que são similares entre si. A investigação e uso de tais algoritmos são essenciais, principalmente diante do vasto número de situações do mundo real existentes; uma situação representada por um volume de dados pode ser melhor organizada e, consequentemente, melhor entendida, se tais dados forem agrupados, usando como critério a similaridade entre eles. Os dados x e y pertencem a um mesmo grupo se eles forem similares.
Em [Theodoridis e Koutroumbas 2009] e [Jain et. al. 1999] podem ser vistas mais definições de agrupamentos, bem como uma organização de categorias e de classificações para os seus algoritmos.


Voltar para o WCF

FACULDADE CAMPO LIMPO PAULISTA - FACCAMP
R. Guatemala, 167 - Jardim América - Campo Limpo Paulista / SP - CEP: 13231-230
Telefone/FAX: (11) 4812-9400