CasaInformaçõesO CPO é o verdadeiro sinal para o próximo estágio da IA?Por que as interconexões de GPU estão sendo reescritas

O CPO é o verdadeiro sinal para o próximo estágio da IA?Por que as interconexões de GPU estão sendo reescritas

CPO: Reescrevendo a interconexão da infraestrutura de IA |Hardware de IA de última geração

O CPO é o verdadeiro sinal para o próximo estágio da IA?
Por que as interconexões de GPU estão sendo reescritas

Quando a largura de banda de uma única GPU atinge níveis de Tb/s e os clusters são dimensionados para dezenas de milhares de placas, vários problemas se tornam dolorosamente reais: o cobre não é rápido o suficiente, o consumo de energia é insustentável, as limitações de distância impedem a expansão e até mesmo a própria arquitetura do sistema começa a falhar.

É neste contexto que surgiu a Co-Packaged Optics (CPO).

⚡ O panorama geral: CPO não é uma otimização de interconexão – é uma reescrita da interconexão.Ele move o mecanismo óptico diretamente dentro do pacote, transferindo problemas tradicionalmente resolvidos no nível da placa para o nível do chip.

A princípio, pensei que o CPO fosse apenas mais uma iteração do módulo óptico.Mas quanto mais fundo você olha, mais claro fica.Ele não apenas reduz o consumo de energia – elimina caminhos inteiros de transmissão elétrica.Está até forçando uma reformulação das arquiteturas dos data centers, desde a topologia da rede até os métodos de resfriamento.

CPO não é a evolução de um único componente.É uma reestruturação fundamental de toda a infraestrutura computacional.E esse pode ser o verdadeiro sinal de que a IA está entrando na sua próxima fase.

1. O que isso realmente significa?

CPO não é uma simples “atualização de módulo”.Representa uma reestruturação completa da arquitetura de interconexão para computação de IA.

2. Conclusão central: o gargalo mudou de “computação” para “conexão”

No passado, os gargalos da IA estavam na computação (GPU).Hoje, as restrições reais em todo o sistema são: largura de banda insuficiente, consumo excessivo de energia e distância limitada de interconexão.Os relatórios da indústria afirmam agora claramente que interconexões de cobre tradicionais + módulos ópticos conectáveis estão se aproximando dos limites físicos.

📌 Conclusão: À medida que a IA entra na sua próxima fase, o gargalo passou de “computação” para “conexão”.

3. A essência do CPO: trazendo a óptica diretamente para o pacote

O CPO faz uma coisa crítica: Ele agrupa o mecanismo óptico e o chip de comutação.

As mudanças fundamentais que isso traz:

  • Caminho do sinal elétrico: de centímetros → micrômetros
  • Conversão óptico-elétrica: do nível da placa → nível do pacote
  • Estrutura do sistema: desde módulos discretos → alta integração
📌 Resumo de uma frase: O CPO não se trata de “substituir a eletricidade pela luz”.É sobre redesenhando a fronteira entre eletricidade e luz.

4. Quatro Valores Fundamentais: Densidade, Eficiência, Desempenho e Arquitetura

1️⃣ Alta densidade: um aumento na ordem de grandeza

5–40
Gbps/mm (conectável)
50–200
Gbps/mm (CPO)

Resultado: Melhoria de aproximadamente 10x na largura de banda por unidade de área.

2️⃣ Alta eficiência energética: >50% de redução de energia

Ao remover os DSPs (o maior consumidor de energia) e encurtar drasticamente o caminho elétrico:

~65%
Redução de energia (interface óptica)
~50%
Economia de energia em nível de sistema

O principal insight: Isso não está otimizando o consumo de energia. Isso está eliminando a fonte de consumo de energia.

3️⃣ Alto desempenho: resolvendo a integridade do sinal

Links elétricos longos sofrem severa atenuação de sinal.O CPO quase elimina a perda de link, permitindo suporte para interconexões de classe 224G+ SerDes e Tb/s.

4️⃣ Reestruturação arquitetônica: simplificação em nível de sistema

O CPO traz três mudanças estruturais:

  • Roteamento de placa simplificado (menos fibras, menos conectores)
  • Gerenciamento térmico unificado
  • Complexidade reduzida do sistema

A essência: Passando de "emenda de módulo" para "design integrado ao sistema."

5. O verdadeiro impulsionador: expansão, não expansão tradicional

Aqui está uma distinção crítica: O principal mercado da CPO não é a rede de expansão, mas sim a expansão.

Por que?A largura de banda entre GPUs (por exemplo, NVLink a 7,2 Tb/s) está crescendo tão rapidamente que excede em muito as capacidades das interconexões Ethernet tradicionais.

📌 Conclusão: O principal campo de batalha para as interconexões da próxima geração é conexões de largura de banda ultra-alta em um único nó ou rack.

6. Restrições do mundo real: o CPO não vem de graça

Nenhuma tecnologia é perfeita.O CPO tem quatro grandes desafios hoje:

  • Flexibilidade reduzida: Os módulos ópticos não podem ser facilmente trocados.O sistema fica "travado".
  • Gerenciamento térmico difícil: Chips de alta potência fortemente acoplados a dispositivos ópticos criam densidades térmicas tão altas quanto 500W/cm².
  • Problemas de rendimento: O rendimento no nível do sistema diminui exponencialmente.Uma única falha pode destruir todo o pacote.
  • Ciclos de iteração incompatíveis: A tecnologia óptica evolui rapidamente, mas uma vez embalada e integrada, as atualizações tornam-se muito difíceis.
Resumo de uma frase: Negociações de CPO desempenho em nível de sistema para complexidade em nível de sistema.

7. Impacto na indústria: uma reestruturação completa da cadeia de valor

O CPO não é uma inovação pontual.Está reestruturando toda a indústria:

  • O valor está subindo a montante: Chips fotônicos de silício, lasers, motores ópticos.
  • As barreiras à entrada estão a mover-se a montante: Embalagem avançada, co-design e fabricação optoeletrônica.
  • Novas demandas estão sendo criadas: Sistemas otimizados para IA, soluções de refrigeração líquida.

O sinal claro dos relatórios da indústria: O CPO está se tornando rapidamente a camada tecnológica fundamental para a próxima geração de infraestrutura de computação de IA.

CPO Óptica Co-embalada Infraestrutura de IA Interconexão de GPU fotônica de silício expansão versus expansão Centro de dados de IA embalagem avançada 1.6T Alternativa NVLink

Com base na análise de relatórios do setor e nas tendências atuais da infraestrutura de IA.