Aprendizado de Máquina (AM) é uma das muitas subáreas da área de pesquisa denomi-nada Inteligência Artificial (IA). O chamado aprendizado indutivo de máquina (AIM) é o modelo de AM mais popular e mais bem sucedido e tem sido implementado utilizando inúmeras técnicas e algoritmos (ver [Mitchell 1997]). Para viabilizar AIM é mandatório que um conjunto de instâncias, que representam os conceitos a serem aprendidos, esteja disponível. Esse conjunto de instâncias é denominado conjunto de treinamento. Conjun-tos de treinamento geralmente são descritos por vetores de pares atributo valor_de_atri-buto e, dependendo da situação, de uma classe associada (que indica qual conceito a ins-tância em questão representa). A classe de cada instância que participa do conjunto de treinamento é, na maioria dos casos, determinada por um especialista humano da área de conhecimento descrita pelos dados.
Dentre os muitos modelos de aprendizado supervisionado (e.g., simbólico, neural, etc.), encontra-se aquele chamado de aprendizado baseado em instâncias (ABI) (também conhecido como aprendizado preguiçoso (lazy learning)). Como comentado em [Mitchell 1997] algoritmos que implementam ABI, via de regra, simplesmente armazenam as ins-tâncias de treinamento e adiam o processo de 'generalização' até o momento em que uma nova instância, de classe desconhecida, precisa ser classificada. Uma vantagem desse tipo de aprendizado é que, ao invés de generalizar o conceito, considerando todo o conjunto de treinamento disponível, estima o conceito localmente, para cada nova instância a ser classificada. Uma das desvantagens de algoritmos baseados em instâncias é o custo da classificação, quando o conjunto de treinamento é volumoso e envolve, também, um grande número de atributos, uma vez que todo o processamento requerido acontece na fase de classificação, dado que a fase de aprendizado consiste simplesmente no armaze-namento do conjunto de treinamento.