Amigos, parte do trato para a Gigabyte fornecer a P67A-UD5 para as apresentações de overclock extremo com a Intel era que eu fizesse um review da placa. Porém, antes de entrar em detalhes sobre a placa em si, acho que cabe conhecermos melhor a arquitetura Sandy Bridge e alguns detalhes sobre os novos processadores “Core i” da segunda geração.
Olhando do alto, os processadores não mudaram muito: ainda temos i3, i5 e i7. Os i3 ainda são dual core com HT (2 núcleos / 4 threads), os i5 ainda são quad core sem HT (4 núcleos / 4 threads) e os i7 ainda são quad core com HT (4 núcleos / 8 threads). À medida que vamos aprofundando na arquitetura vamos conhecendo melhor as novidades.
Começando pelos i3, que antes eram compostos por dois chips, um já feito no processo de 32nm que abriga os núcleos e o cache L3, enquanto o outro (ainda feito no processo de 45nm) engloba controladora de memória, controlador PCI Express e a GPU Intel GMA HD, o popular vídeo onboard. Os chips se comunicam por um barramento QPI (o mesmo usado para ligar os Xeon entre si, ou os i7 do socket LGA 1366 ao X58). Outro detalhezinho que vale a pena chamar atenção é que os núcleos do i3 (e i5 série 600) são baseados na arquitetura Westmere, uma ligeira revisão da consagrada arquitetura Nehalem (dos demais i5 e i7, séries 700, 800 e 900), que trouxe suporte ao conjunto de instruções SSE4.2, que incluem principalmente instruções AES, que aceleram e muito operações de criptografia. Os Core i7 de 6 núcleos do socket LGA 1366, feitos no processo de 32nm, como o 970 e o 980x utilizam a mesma arquitetura.
Os novos i3 são constituídos de um único chip, feito no processo de 32nm, que abriga seus dois núcleos da arquitetura Sandy Bridge e todos os demais blocos: controladora de memória, cache L3, controlador PCI Express e a GPU, uma versão melhorada da GMA HD.
Os i5 e i7 da segunda geração (são baseados no mesmo chip, no i5 o HT é simplesmente desativado), continuam com seus 4 núcleos, 8MB de cache L3 (reduzido para 6MB nos i5), controladora de memória dual channel e controlador PCI Express (16 linhas PCIe 2.0). Além da nova arquitetura e da miniaturização para 32nm, uma novidade significativa da segunda geração é que agora mesmo os processadores Quad Core possuem GPU integrada.
Isso finalmente acaba com a salada de que processador usar com que placa que confundia muita gente. Afinal, era possível usar um Core i5 760, por exemplo, em uma placa com chipset H55 (que possui as saídas de vídeo), porém era obrigatório o uso de uma placa de vídeo, já que o processador não integrava uma GPU (como os i3). Agora é simples, todos os processadores da série 2000 têm GPU, se sua placa mãe tem as saídas de vídeo (caso das placas H61 e H67), você pode usá-las. Você só deve obrigatoriamente usar uma placa de vídeo se sua placa mãe não tem suporte à GPU integrada no processador (caso das placas P67). E nada o impede de usar uma placa de vídeo em uma placa H61/H67, o vídeo integrado é desabilitado automaticamente quando uma placa de vídeo estiver presente.
Quanto à GPU em si, possui 6 ou 12 unidades, dependendo do processador, contra 10 do GMA HD dos i3 da primeira geração, mas teve sua eficiência dobrada, então mesmo um processador com GPU de 6 “EUs” já deve oferecer um desempenho superior à GPU de 10 “EUs” da geração anterior. E como esta agora é feita com os mesmos transistores de 32nm que o restante do processador, pode atingir frequências maiores, além de ser beneficiada pelo TurboBoost mais agressivo (em alguns processadores a GPU pode trabalhar a até 1.35GHz, contra no máximo 900MHz da geração anterior).
Nos testes que eu vi, a GPU com 6 EUs tende a ser no mínimo equivalente à do chipset AMD 890GX (Radeon HD 4290), por exemplo, enquanto a de 12 EUs (por enquanto presente apenas nos processadores da série “K”, mais sobre eles logo mais) se comporta +- como uma placa de vídeo atual de entrada, como a Radeon HD 5450.
Finalmente, sobre a arquitetura SandyBridge em si, apesar de poder ser considerada “apenas” uma evolução da arquitetura Nehalem, possui uma série de novidades bem interessantes. O decodificador de instruções foi melhorado, integrando um cache para instruções já decodificadas (micro-OPs), o que ajuda na performance além de reduzir o consumo (pois quando uma instrução é reaproveitada do cache em vez de ser novamente decodificada o decodificador permanece desligado).
O previsor de desvios (Branch Prediction) foi totalmente refeito e o sistema de execução fora de ordem agora é baseado em um sistema de registro estático e ponteiros. Em vez das instruções viajarem completas (com dados e tudo) pelo pipeline, ocupando muito espaço e gastando muita energia; elas permanecem num buffer enquanto ponteiros com referências a essas instruções viajam por ai. Essa redução é especialmente importante agora que foi introduzido o suporte a instruções AVX, de 256 bits. A economia em espaço permitiu um aumento generoso no tamanho do buffer de instruções, cerca de 33%.
Por último, mas não menos interessante, o cache L3 agora trabalha à mesma frequência que os núcleos (em vez de ficar num plano separado, como na série anterior, que ficava dentro da porção Uncore, junto à controladora de memória). E em vez de cada núcleo ter um caminho próprio ao cache L3 (o que torna o acesso cada vez mais complicado conforme são integrados mais núcleos no processador), agora há um belo barramento tipo anel ao redor do processador, com uma “parada” em cada fatia de cache L3 (2MB cada), cada núcleo, além da GPU.
A cada ciclo, o barramento move 32 Bytes de dados de uma parada a outra, até que estes cheguem ao seu destino. Como este trabalha à frequência dos núcleos, a banda aumentou para cerca de 96GB/s por núcleo (a 3GHz) e como o controle de acesso foi simplificado, a latência do cache L3 diminuiu de 36 ciclos para algo entre 26 e 31 ciclos (dependendo de qual núcleo faz a requisição e de qual fatia do cache a informação deve sair).
Fora isso a controladora de memória foi redesenhada, atingindo praticamente a mesma eficiência da controladora Triple Channel (3 canais) dos processadores do socket LGA1366 com apenas dois canais. Outros detalhes subjetivos, mas bastante interessantes é que graças à redução no consumo de energia, a faixa de frequência que os processadores usam subiu consideravelmente para os mesmos envelopes térmicos.
Por exemplo, enquanto um Core i5 da série anterior, com TDP de 95w trabalhava a 2,6GHz ou 2.8GHz (i5 750 e 760, respectivamente). Respeitando os mesmos 95w é possível trabalhar a 3.1GHz ou 3.3GHz (i5 2400 e 2500, respectivamente), isso sem contar o TurboBoost mais agressivo, que os leva a até 3.7GHz (i5 2500) sempre que possível.
E tudo isso foi feito mantendo as mesmas faixas de preço. Um i3 novo custa o mesmo (se não menos) que um i3 anterior, um i5 ou i7 idem.
A ponto negativo é que apesar da semelhança funcional (2 canais de memória, barramento DMI, etc) e até do socket ser praticamente o mesmo (LGA1155 contra LGA1156) as duas plataformas (nova e antiga) são totalmente incompatíveis. Quer dizer que os novos processadores LGA1155 não funcionam em placas LGA1156, nem placas LGA1155 suportam processadores LGA1156.
Novas placas serão necessárias para os novos processadores, e é aí que entra o P67. Basicamente uma evolução do P55, este traz poucas, porém significativas, novidades. Das suas 6 portas SATA, duas foram atualizadas para suportar SATA III (6Gbps). E, finalmente, suas linhas PCI Express para uso geral (ligação das controladoras de rede, USB 3.0, controladoras SATA adicionais, firewire, slots PCIe x4 ou x1, etc) foram atualizadas para suportar PCI Express 2.0. E para comportar o maior tráfego de dados, o canal DMI (basicamente um apanhado de 4 linhas PCI Express) que liga o chipset ao processador, também foi atualizado para suportar PCI Express 2.0, dobrando sua banda. Infelizmente o suporte a USB 3.0 ainda não foi implementado, então depende dos fabricantes de placas mãe integrar uma controladora nas placas. Por sorte a maioria faz isso, mas não espere ver o recurso em placas mais simples.
Além do P67 foi lançado o H67, que oferece basicamente os mesmos recursos e barramento FMI, para aproveitar a GPU integrada nos processadores. E o H61, uma versão de baixo custo do H67, sem controladora SATA III (portanto conta com apenas 4 portas SATA II), nem suporte a RAID.
Um detalhe importante para os amigos overclockers. O clock base, que serve de referência para a frequência de trabalho do processador (que era de 133MHz e agora é de 100MHz) foi bloqueado. O gerador desse clock agora fica dentro do chipset e este não gosta de operar fora da especificação, então diga adeus ao overclock pelo clock base (equivalente ao FSB).
Overclock agora só é possível com um processador que tenha o multiplicador desbloqueado. Felizmente, não é necessário adquirir um processador “Extreme Edition”, que normalmente são apelidados de “Expensive Edition” (já que sempre custam 1000 dólares), para isso. Há versões “K”, pouca coisa mais caras que as normais, que permitem brincar com o multiplicador. Um Core i5 2500k, por exemplo, custa lá fora apenas 15 dólares a mais que o 2500 normal. Aqui a diferença não deve (ou não deveria…) ultrapassar os R$ 50,00.
E o suporte a memórias de alto desempenho está liberado, a controladora de memória dos SandyBridge permite usar até DDR3-2133, mesmo em processadores “não K”. Só há um pequeno porém… tanto os ajustes para overclock no processador, quanto na memória só estão disponíveis nas placas P67. As placas H67 e H61 não podem manipular os multiplicadores, portanto mesmo que estes estejam desbloqueados, ficaram limitados aos valores oficiais (clock padrão + turbo e memórias DDR3-1333).
Processadores não “K” mas com TurboBoost permitem o que a Intel chama de “overclock limitado”, basicamente você pode enganar o Turbo para que este leve não apenas um, mas todos os núcleos ao clock máximo do Turbo (3.7GHz num i5 2500, por exemplo). Não é grande coisa, mas já ajuda um pouco.
Enquanto processadores sem Turbo (como os i3) simplesmente não fazem overclock algum. Nos núcleos… Pelo menos o clock da GPU é livre. Só tenho que confirmar se isso também vale para as placas H61.
Ufa, acho que isso já resume bem a nova série de processadores. Ahh sim, um último detalhe: a Intel já anunciou que os próximos processadores (baseados na arquitetura Ivy Bridge), que serão lançados no começo de 2012, já feitos no processo de 22nm, embora associados a novos chipsets (a série 7, de codinome Panther Point) funcionarão nas placas LGA1155 já disponíveis.
Até a próxima, com essa belezinha aí.
Por Alexandre Ziebert
http://twitter.com/#!/aziebert
Fonte: em (grande) parte: Anandtech
2 comentários
muito boa essa materia, eu tenho um i5 2500 e queria fazer o over no turbo boost mas não consegui fazer, pois não sei as especificações.
Mas tem um programa que se chama intel extreme tuning utility ele só não aceita mexer nos 100 mhz e nos mutiplicadores mas como no próprio texto diz tem opção para dar over no turbo boost? como?
Por favor se alguem saber.
me responda
Olá FLÁVIO,
Ficamos grato por seus comentários. Turbo BOOST Intel é um ‘dispositivo tecnológico’ do chip que foi agregado e permite fazer um pequeno incremento de velocidade de clock nominal. Isto ocorre desde que sua motherboard aceite esta opção via BIOS. Quanto aos clock base e ao multiplicador do seu 2500, isso ocorre devido ao seu processador tratar-se de um chip bloqueado. Ou seja, os processadores SB que não possuem em sua nomenclatura o ‘k’ são assim de fato contruídos. A velocidade do processador com a tecnologia Turbo Boost está programada para atingir 3,7 Ghz de velocidade máxima.
Qualquer outra dúvida, ou pergunta mais técnica, por favor, utilize nosso fórum. Grato por seus comentários e esperamos ter contribuido um pouquinho com sua dúvida !