Apesar dos avanços em Inteligência Artificial (IA), modelos de Machine Learning e Deep Learning ainda carecem de transparência e explicabilidade, sendo tratados como “caixas-pretas”. Este trabalho aborda o problema das correlações espúrias — associações entre padrões e classes sem relação causal — que, em tarefas de classificação binária em Processamento de Linguagem Natural (PLN), comprometem a precisão, a imparcialidade e a generalização dos modelos. Propomos um método que combina técnicas de Inteligência Artificial Explicável (XAI) e aprendizado não supervisionado para identificar e graduar padrões espúrios. Utilizando o algoritmo K-means, os padrões são agrupados e analisados pela distância aos centroides, sob a hipótese de que distâncias maiores indicam maior grau de espuriedade. A abordagem considera a influência desses padrões sobre explicadores e sua associação com erros de previsão. A metodologia é aplicada a dados de licitações e contratos do Tribunal de Contas do Estado do Piauí (TCE-PI), usando modelos baseados em Support Vector Machine (SVM), Logistic Regression (LR) com representações textuais TF-IDF e Word Embeddings, e o modelo BERTimbau, como codificador e classificador com embeddings contextuais dinâmicos. Aplicamos também o método ao IMDB para avaliar generalização e compará-lo com métodos de referências. Os resultados confirmam a hipótese e mostram consistência entre modelos e bases. As principais contribuições incluem: (i) método agnóstico a modelos e explicadores; (ii) detecção automática de padrões espúrios; (iii) uma métrica de espuriedade baseada na distância ao centroide; e (iv) organização lógica e interpretável dos padrões, ampliando a compreensão dos modelos e apoiando a mitigação de padrões espúrios.