A classificação de rachaduras em superfícies de concreto, alvenaria e afins é uma tarefa essencial para a manutenção preventiva de estruturas civis, pois quando não detectadas a tempo, podem comprometer a integridade estrutural e resultar em custos elevados de reparo.Neste contexto, esta proposta de pesquisa apresenta a WellNet, uma rede neural híbrida que se propõe como uma alternativa entre as abordagens para classificação de rachaduras em estruturas externas. A WellNet combina as capacidades das Redes Neurais Convolucionais (CNN), conhecidas por sua eficiência na extração de características locais, com a abordagem dos Transformadores Visuais (ViT), que captura informações contextuais globais. O modelo foi validado utilizando o conjunto de dados Mendeley, com diferentes configurações de hiperparâmetros e técnicas de aumento de dados. Foram realizados experimentos com e sem aumento de dados, evidenciando que a WellNet apresenta resultados comparáveis a arquiteturas CNN e híbridas em métricas como acurácia de 99,70%, precisão de 99,50%, recall de 99,90% e F1-score de 99,70%. Além disso, o modelo se destaca pelo seu espaço em memória de (26.4 MB), tornando-o viável para uso em sistemas embarcados e dispositivos móveis, facilitando inspeções automatizadas em fachadas de edificações e locais de difícil acesso.