O paradigma de aprendizado não supervisionado é utilizado principalmente em problemas de agrupamento, associação e sumarização de dados. Esses tipos de algoritmos não buscam inferir conclusões a partir de novos conjuntos de dados, mas sim descrever, aprofundar e obter informações sobre um conjunto de dados específico.

Problemas comuns que utilizam aprendizado não supervisionado são problemas de associação e visualização de dados em um grupo. Esses algoritmos permitem, por exemplo, fornecer informações sobre quais tipos de produtos são frequentemente comprados juntos, ou quais perfis de consumidor são mais propensos a comprarem determinada categoria de produto. A Extração de regras de associação e o Agrupamento são dois grandes exemplos de problemas aos quais as técnicas de aprendizado não supervisionado são aplicadas.

O termo “não supervisionado” deriva do fato de que não há algum agente externo, nem há uma saída esperada e conhecida para um determinado conjunto de dados de treinamento. A ideia desse tipo de algoritmo é explorar e derivar informações úteis sobre um conjunto de dados, não generalizar hipóteses para predições com novos dados.