Com o advento e implantação das redes 5G, os estudos iniciais sobre as redes 6G e o crescente número de dispositivos conectados à Internet, a demanda por tráfego de dados está crescendo exponencialmente, impactando a infraestrutura da rede de acesso e de transporte das redes móveis. Considerando a arquitetura Hybrid Cloud Radio Access Network (H-CRAN) e a Open Radio Access Network (O-RAN), que centralizam diversas funções de rede na nuvem e introduzem infraestrutura intermediária virtualizada na borda, surgem novos desafios em relação às tradicionais Redes de Acesso Rádio Distribuído (do inglês, Distributed Radio Access Network -- D-RAN). Esses desafios incluem a necessidade de maior flexibilidade, escalabilidade, latência reduzida e otimização do uso de recursos de rede para suportar cargas de tráfego dinâmicas e variáveis. Neste contexto, o presente trabalho propõe soluções para o balanceamento de carga utilizando particionamento funcional e o uso eficiente dos recursos para redes de acesso fronthaul, com o objetivo de manter a rede operacional e corretamente dimensionada. Para abordar esse problema, emprega-se um modelo baseado em aprendizado por reforço, especificamente o algoritmo Deep Q-Network (DQN) e suas variantes Double-DQN e Dueling-DQN. Os resultados obtidos demonstram que a técnica proposta é capaz de alocar os recursos de rede de forma eficiente, eliminando bloqueios e apresentando vantagens em termos de escalabilidade e viabilidade para aplicações em sistemas de tempo real.