Anais > Edições Anteriores > Anais do XI WCF 2015 > Algoritmos Aglomerativos de Agrupamento Baseados em Teoria de Matrizes

Algoritmos Aglomerativos de Agrupamento Baseados em Teoria de Matrizes

Autores: Rodrigo Camargos e Maria Do Carmo Nicoletti

Um dos primeiros requisitos para a utilização de um sistema computacional que realiza aprendizado indutivo é dispor de um conjunto de dados, conhecido como conjunto de treinamento, que representa o conceito a ser aprendido. Cada dado (ou padrão) de um conjunto de treinamento é, geralmente, descrito por um vetor de atributos (i.e., um vetor de valores associados a atributos) e, dependendo da situação, de uma classe associada (que indica qual conceito o dado em questão representa). A classe de cada padrão do conjunto de treinamento é, na maioria dos casos, determinada por um especialista hu-mano da área de conhecimento à qual pertencem os dados. O fato de a classe participar da descrição do padrão e do algoritmo de aprendizado fazer uso dessa informação carac-teriza a técnica de aprendizado automático como de aprendizado supervisionado (ver [Mitchell 1997], [Witten et al., 2011]).
Em muitas situações do mundo real, entretanto, a classe à qual cada dado per-tence é desconhecida e/ou não existe um especialista humano que, com base na descri-ção dos valores de atributos que descrevem os dados, seja capaz de determiná-la. Téc-nicas de aprendizado indutivo de máquina que lidam com conjuntos de dados que não têm uma classe associada são conhecidas como técnicas de aprendizado não-supervisionado. Uma das técnicas de aprendizado não-supervisionado mais populares é chamada de agrupamento (clustering). O objetivo principal de algoritmos de agrupa-mento é particionar o conjunto de padrões disponível em grupos, de acordo com as si-milaridades e dissimilaridades entre tais padrões. Como pode ser confirmado em pes-quisa bibliográfica associada especificamente à agrupamentos, o número de algoritmos propostos na literatura é considerável (ver, por exemplo, [Theodoridis & Koutroumbas 2009], [Duda et al., 2001], [Jain & Dubes 1988], [Jain 2010]).
Este artigo descreve os passos iniciais e as escolhas feitas até o momento, relati-vas ao projeto de pesquisa em desenvolvimento cujo foco é a investigação empírica de algoritmos de agrupamento caracterizados como hierárquicos, particularmente aqueles que se enquadram na subcategoria de hierárquicos aglomerativos. Algoritmos hierár-quicos produzem uma hierarquia de agrupamentos aninhados; via de regra esses algo-ritmos envolvem N passos ou seja, tantos quantos forem os padrões disponibilizados. A cada passo t um novo agrupamento é produzido usando, para isso, o agrupamento pro-duzido no passo anterior i.e., no passo t1.


Voltar para o WCF

FACULDADE CAMPO LIMPO PAULISTA - FACCAMP
R. Guatemala, 167 - Jardim América - Campo Limpo Paulista / SP - CEP: 13231-230
Telefone/FAX: (11) 4812-9400