O câncer gástrico (CG) permanece entre as principais causas de morte por câncer no Brasil e no mundo, com altas taxas de incidência e mortalidade, especialmente em países em desenvolvimento. A oncologia moderna evoluiu de modo a estratificar os pacientes em grupos distintos, com base nas características genotípicas e fenotípicas dos tumores, bem como em seus respectivos desfechos clínicos. Nesse contexto, o estudo do microambiente tumoral (TME) é essencial para a definição de condutas terapêuticas individualizadas e eficazes. Assim, a classificação automatizada dos componentes do TME por meio de modelos de aprendizado profundo (DL Deep Learning) surge como uma alternativa promissora. Apesar dos avanços em patologia digital, a classificação automática dos diferentes componentes teciduais do TME em lâminas coradas com Hematoxilina e Eosina (H&E) ainda é pouco explorada em CG. Diante dessa lacuna, este trabalho propõe um método de classificação multiclasse, baseado em um ensemble hierárquico de dois níveis, composto por modelos de DL. Foram avaliadas doze arquiteturas pré-treinadas em ImageNet (EfficientNet, ViT, MobileNet, Xception, VGG, ResNet, DenseNet, AlexNet, entre outras), explorando transferência de aprendizado, extração e concatenação de embeddings, arranjos hierárquicos de classificadores binários, variação do número de neurônios nas camadas totalmente conectadas e técnicas de aumento de dados em tempo de execução. Os experimentos foram conduzidos sobre o conjunto de dados HMU-GC-HE-30K, composto por 31.096 patches balanceados em oito classes de tecidos, utilizando validação cruzada estratificada (k = 8), e 20% das imagens reservadas para teste externo. A partir dos melhores modelos, foi construído um ensemble hierárquico de dois níveis: comitês locais homogêneos e, em seguida, um comitê global entre arquiteturas distintas, usando as predições do comitê local. Os melhores resultados obtidos nos conjuntos de teste indicaram o comitê c20 como o mais performático, obtendo acurácia de 81,2%, AUC de 98,1% e F1-score de 81,2%, superando em mais de dez pontos percentuais o baseline da literatura para essa base, e demonstrando a superioridade do ensemble hierárquico frente a classificadores isolados. Esse comitê usou como estratégia de apuração a média ponderada pelo F1-scorede cada classe de classificador membros. Esses achados mostram que a combinação estruturada de arquiteturas diversas, aplicada a um comité hierárquico, reduz a variância entre execuções e aumenta a capacidade discriminativa em cenários multiclasse complexos, contribuindo para o avanço da patologia digital assistida por Inteligência Artificial (IA).