Como diagnosticar falhas de hardware com ferramentas gratuitas

O computador reinicia sozinho sem aviso. A tela congela no meio de um jogo. O sistema demora absurdos três minutos para abrir um arquivo simples. Antes de sair comprando peças novas ou levando a máquina para uma assistência técnica, existe uma etapa que muita gente pula: o diagnóstico sistemático com ferramentas gratuitas que qualquer pessoa consegue usar.

Tenho acompanhado fóruns e chamados técnicos há anos, e o padrão se repete: o usuário troca um componente caro baseado em suposição, e o problema continua. O diagnóstico correto economiza dinheiro, tempo e frustração. Neste guia, você vai entender como testar cada componente crítico do seu PC ou notebook sem gastar nada.

Por que o diagnóstico precisa vir antes da solução

Falhas de hardware raramente aparecem com mensagem clara. Um stick de RAM com defeito pode se manifestar como tela azul aleatória, travamento em jogos ou até corrupção de arquivos — os mesmos sintomas de um disco ruim ou de um driver corrompido. Sem um método, você está chutando.

O princípio básico é testar um componente por vez, isolando variáveis. Comece sempre pelos mais fáceis de verificar: temperatura, disco e memória. GPU e placa-mãe ficam para o final, porque exigem mais passos. Se você já está vendo programas travando ou não abrindo no Windows, o diagnóstico de hardware é o ponto de partida certo antes de mexer em software.

Superaquecimento causa throttling, travamentos e desligamentos abruptos.
RAM com defeito gera erros de memória que o Windows disfarça como falhas de aplicativo.
Disco degradado aparece como lentidão severa, demora no boot e arquivos corrompidos.
Fonte subcapacitada ou instável provoca reinicializações aleatórias sob carga.

Ter clareza sobre qual componente está falhando também define se vale a pena consertar ou substituir a máquina inteira. Além disso, documentar os resultados de cada teste — mesmo que seja num bloco de notas simples — facilita muito a comunicação com um técnico caso você precise de ajuda profissional depois. Um laudo próprio, ainda que informal, já elimina horas de retrabalho diagnóstico.

Monitorando temperatura com HWMonitor e Core Temp

Como diagnosticar falhas de hardware com ferramentas gratuitas — (c) Fábrica de Bugs | Imagem ilustrativa

O superaquecimento é a causa mais subestimada de instabilidade. Um processador moderno começa a reduzir a frequência automaticamente quando ultrapassa 90–95 °C — fenômeno chamado de throttling térmico. O resultado prático é uma máquina que parece lenta sem nenhuma razão aparente.

O HWMonitor, desenvolvido pela CPUID, é gratuito e mostra em tempo real as temperaturas de CPU, GPU, discos e sensores da placa-mãe. O Core Temp é mais enxuto e foca no processador, exibindo a temperatura por núcleo individualmente — útil para identificar se apenas um núcleo está superaquecendo por pasta térmica aplicada de forma irregular.

Como usar na prática: abra o HWMonitor e deixe-o em segundo plano enquanto reproduz uma tarefa que causa o problema — um jogo, uma renderização, uma compilação. Observe os picos de temperatura. Processadores de notebook em carga pesada costumam operar entre 80 °C e 90 °C, o que é aceitável. Acima de 95 °C de forma sustentada é sinal de problema térmico sério: pasta térmica ressecada, duto de ar obstruído por poeira ou cooler com defeito.

Se o seu Windows 11 está consumindo muita RAM e a temperatura da CPU está constantemente elevada, você pode estar diante de dois problemas simultâneos — e o térmico precisa ser resolvido primeiro.

Outro detalhe frequentemente ignorado: a temperatura dos discos também aparece no HWMonitor. SSDs NVMe em uso intenso podem ultrapassar 70 °C em configurações sem dissipador adequado, o que ativa o throttling térmico do próprio armazenamento e degrada a velocidade de leitura e escrita de forma significativa. Manter esse valor abaixo de 60 °C é o ideal para longevidade e desempenho estável.

Testando a memória RAM com o Windows Memory Diagnostic e MemTest86

A memória RAM com defeito é traiçoeira. Ela passa meses funcionando aparentemente bem e depois começa a gerar erros intermitentes que o sistema operacional interpreta como falhas de software. Dois erros MEMORY_MANAGEMENT em tela azul em uma semana já justificam um teste de RAM.

O Windows Memory Diagnostic está embutido no sistema: pressione Win + R, digite mdsched.exe e reinicie. O teste roda antes do Windows carregar e leva entre 15 e 30 minutos dependendo do volume de RAM. Ele detecta os erros mais óbvios, mas tem limitações.

Para um diagnóstico mais rigoroso, use o MemTest86. É gratuito, funciona fora do sistema operacional (via pendrive bootável) e executa uma bateria de 13 algoritmos de teste diferentes. O ideal é deixar rodar pelo menos dois ciclos completos — o que pode levar de duas a oito horas, dependendo da quantidade de memória instalada. Qualquer erro indicado, mesmo um único, é motivo para trocar o pente ou testá-lo em outro slot.

Uma dica prática que aprendi da forma mais dura: se você tem dois pentes de RAM, teste um de cada vez. Às vezes apenas um está com problema e o outro está perfeito. Isso economiza a troca desnecessária do par completo.

Outro ponto que muita gente ignora é o slot em si. Pentes de RAM podem apresentar erro em um slot específico por conta de um pino oxidado ou danificado na placa-mãe, e não por defeito no pente. Antes de descartar um módulo de memória, troque-o de slot e repita o teste. Essa simples troca já resolveu problemas que pareciam ser de hardware defeituoso em diversas situações documentadas em fóruns técnicos.

Verificando a saúde do disco com CrystalDiskInfo e CrystalDiskMark

Discos rígidos tradicionais (HDs) e SSDs falham de formas diferentes, mas ambos podem ser monitorados com o CrystalDiskInfo, uma das ferramentas mais confiáveis da categoria. Ele lê os atributos S.M.A.R.T. do dispositivo — um sistema de automonitoramento integrado aos próprios discos — e apresenta um status geral: Good, Caution ou Bad.

Os atributos mais críticos para HDs são: Reallocated Sectors Count (setores realocados), Pending Sectors (setores aguardando releitura) e Uncorrectable Sectors. Qualquer valor diferente de zero nesses três já indica degradação real. Para SSDs, observe o Wear Leveling Count e o Total Bytes Written, que indicam quanto da vida útil do dispositivo foi consumida.

Se o CrystalDiskInfo mostrar status Caution, faça backup imediato dos dados antes de qualquer outra coisa. Não espere para ver se piora. Se você suspeita que o HD está falhando, o CrystalDiskInfo vai confirmar ou descartar em menos de dois minutos.

Já o CrystalDiskMark mede a velocidade de leitura e escrita do disco. Um SSD NVMe que deveria entregar 3.000 MB/s de leitura sequencial, mas está mostrando 400 MB/s, pode estar com problema no controlador ou na interface. Um HD que operava a 120 MB/s e agora marca 40 MB/s está claramente degradado. Se o seu disco aparece a 100% no Windows, essa medição de velocidade real ajuda a separar problema de software de falha física.

Diagnosticando a GPU com FurMark e GPU-Z

Problemas na placa de vídeo normalmente se manifestam como artefatos visuais na tela — pontos coloridos aleatórios, triângulos mal renderizados, listras —, quedas bruscas de desempenho em jogos ou crashes com código de erro relacionado ao driver de vídeo.

O GPU-Z, da TechPowerUp, exibe informações detalhadas da GPU: clock, temperatura, uso de VRAM, velocidade do barramento. Com ele você consegue confirmar se a placa está operando nas frequências corretas e se a temperatura de repouso está razoável (geralmente abaixo de 50 °C sem carga).

O FurMark é o teste de estresse de GPU mais popular. Ele força a placa ao limite por um período controlado — normalmente 15 a 30 minutos — enquanto monitora temperatura e estabilidade. Se a tela travar, aparecerem artefatos visuais ou o sistema reiniciar durante o teste, a GPU é a suspeita principal. Um resultado normal: temperatura sobe para 70–85 °C, estabiliza e o sistema permanece estável durante todo o teste.

Atenção: em notebooks com GPU integrada e discreta, o FurMark às vezes ativa apenas a integrada. Verifique no GPU-Z qual placa está sendo testada antes de concluir qualquer coisa.

Para complementar o FurMark, o Unigine Heaven é outra opção gratuita que combina estresse visual com cenas mais próximas de situações reais de uso em jogos. Ele é menos agressivo do que o FurMark, o que o torna mais adequado para identificar falhas intermitentes que só surgem sob carga moderada e prolongada — aquele tipo de crash que acontece depois de 40 minutos de jogo, mas nunca aparece em benchmarks curtos.

Testando a fonte de alimentação e a estabilidade geral

A fonte de alimentação é o componente mais negligenciado no diagnóstico doméstico — e uma das fontes mais comuns de instabilidade sistêmica. Uma fonte que entrega voltagem instável pode causar reinicializações sob carga, falhas na leitura de discos e até danos em outros componentes ao longo do tempo.

Sem um multímetro ou uma fonte de teste dedicada, a verificação direta é difícil para o usuário leigo. Mas o HWMonitor mostra as voltagens reportadas pela placa-mãe nos rails +12V, +5V e +3.3V. Flutuações acima de 5% do valor nominal são sinal de alerta. Se você suspeita de problema na fonte de alimentação, esse monitoramento de voltagem é o primeiro passo antes de qualquer decisão.

Para um teste de estresse combinado — CPU, RAM e disco ao mesmo tempo — o OCCT (gratuito para uso pessoal) é excelente. Ele estresa todos os componentes simultaneamente e registra qualquer erro ou queda de voltagem. Se o sistema reiniciar ou travar durante o teste de 30 minutos do OCCT, você tem um problema de estabilidade que pode ser a fonte, a RAM ou a própria placa-mãe.

Se depois de todos os testes nenhuma ferramenta apontar problema evidente, vale investigar a placa-mãe em detalhes — especialmente se os sintomas incluírem falhas intermitentes sem padrão claro.

Fontes de entrada de nível básico, mesmo quando novas, podem não sustentar o pico de consumo em sistemas com GPU dedicada de alto desempenho. Uma fonte com capacidade nominal de 500W pode entregar apenas 420W de forma estável nos rails principais — o que já é insuficiente para configurações com CPU e GPU de geração recente sob carga simultânea. Conferir a especificação real do pico de consumo do seu sistema contra a capacidade efetiva da fonte é um passo que muitas vezes resolve reinicializações misteriosas sem necessidade de trocar qualquer outro componente.

Conclusão

Diagnosticar falhas de hardware não exige equipamento caro nem formação técnica avançada. Com HWMonitor, MemTest86, CrystalDiskInfo, GPU-Z e OCCT, você cobre os componentes responsáveis pela grande maioria das falhas que aparecem no dia a dia. O método importa mais do que a ferramenta: teste um componente por vez, documente os resultados e só tire conclusões depois de ter dados concretos. Se a temperatura está normal, o disco está saudável, a RAM passou no MemTest86 e a GPU aguentou o FurMark, você já eliminou as causas mais prováveis — e isso por si só é um diagnóstico valioso.

FAQ

Qual ferramenta gratuita é melhor para testar a memória RAM?

O MemTest86 é a opção mais completa para diagnóstico de RAM. Ele roda fora do Windows via pendrive bootável e executa 13 algoritmos de teste diferentes. Para um teste rápido sem sair do sistema, o Windows Memory Diagnostic (mdsched.exe) já resolve em casos simples.

O CrystalDiskInfo funciona para SSDs ou apenas para HDs?

Funciona para ambos. O programa lê atributos S.M.A.R.T. de HDs, SSDs SATA e SSDs NVMe. Para SSDs, os atributos relevantes são diferentes dos de HDs — o programa já diferencia e apresenta o status de forma adequada para cada tipo de dispositivo.

Temperatura alta na CPU é sempre problema de hardware?

Não necessariamente. Pode ser pasta térmica ressecada (solução simples e barata), cooler obstruído por poeira ou configurações de perfil de energia no Windows. Antes de suspeitar de falha no processador, limpe o cooler, verifique a pasta térmica e ajuste o plano de energia para Balanceado.

O FurMark pode danificar minha GPU?

Em hardware saudável e com resfriamento adequado, não. O FurMark aumenta a temperatura da GPU significativamente, mas placas modernas têm proteção térmica que reduz o clock ou desliga o sistema antes de causar dano. O risco existe em GPUs já com problemas de resfriamento ou overclock instável — justamente o cenário em que o teste revelaria o problema.

Se todas as ferramentas mostrarem resultados normais, o problema é software?

Provavelmente sim, mas não é garantia absoluta. Algumas falhas de hardware são intermitentes e não aparecem durante testes curtos. Se os sintomas persistirem após verificação de software, repita os testes com duração maior — especialmente o MemTest86 com quatro ciclos completos e o OCCT por uma hora.

Preciso desinstalar os programas de diagnóstico após o uso?

Não é obrigatório, mas é uma boa prática manter pelo menos o HWMonitor e o CrystalDiskInfo instalados para monitoramento contínuo. O HWMonitor consome recursos mínimos em segundo plano e pode alertar para variações de temperatura ou voltagem antes que se tornem um problema grave. Já ferramentas de estresse como FurMark e OCCT não precisam ficar instaladas permanentemente — você as usa pontualmente quando surge um sintoma e pode removê-las depois.