Diagnóstico de cultura de segurança: 7 falhas que tornam o instrumento inútil
Sete falhas recorrentes transformam o diagnóstico de cultura em pesquisa de clima de RH disfarçada, e produzem relatório bonito sem capacidade de mover o risco real
Principais conclusões
- 01Recuse instrumento de diagnóstico cultural cujo questionário foi adaptado de pesquisa de clima de RH, porque medir sentimento sobre segurança não é equivalente a medir comportamento de risco observável.
- 02Estratifique a amostra por pelo menos quatro níveis hierárquicos, já que o gap entre a percepção da diretoria e a percepção do operador da ponta supera 30 pontos na maioria das operações industriais.
- 03Substitua perguntas sobre sentimento ("você se sente seguro") por perguntas sobre comportamento ocorrido ("quantas vezes recusou tarefa por risco nos últimos 30 dias"), porque comportamento mensurado é a única âncora confiável.
- 04Apresente devolutiva por estrato em vez de média global, porque o achado mais valioso de qualquer diagnóstico cultural é o gap entre o que a cúpula acredita e o que a operação vivencia, e a média esconde esse abismo.
- 05Contrate o Diagnóstico de Cultura de Segurança com a consultoria de Andreza Araujo quando a operação chegou a 200 funcionários ou cresceu por aquisição nos últimos 24 meses, e o painel atual ainda depende exclusivamente de TRIR para sinalizar risco cultural.
Diagnóstico de cultura de segurança virou rótulo. Em mais de 250 projetos de transformação cultural acompanhados por Andreza Araujo, o instrumento aplicado pela maioria das empresas era pesquisa de clima de RH com cinco perguntas reescritas. O resultado tende a se repetir em quase todos os casos: relatório agradável de ler, plano de ação inviável, e indicador leading que não se move nos vinte e quatro meses seguintes. Este artigo descreve as sete falhas estruturais que separam um diagnóstico capaz de mexer com SIF de um questionário de satisfação fantasiado de método.
Por que pesquisa de clima virou substituto barato do diagnóstico
A confusão entre diagnóstico de cultura de segurança e pesquisa de clima organizacional é a primeira armadilha, porque os dois instrumentos respondem a perguntas diferentes. A pesquisa de clima mede o quanto o funcionário está satisfeito com a empresa, ao passo que o diagnóstico de cultura mede o quanto a operação tolera desvio, recusa de tarefa, reporte de quase-acidente e questionamento da liderança. Como Andreza Araujo defende em Diagnóstico de Cultura de Segurança, esses são objetos distintos, e qualquer instrumento que confunde um com o outro entrega uma fotografia sem foco.
O segundo motivo da popularidade do atalho é orçamentário. Pesquisa de clima é commodity de mercado, com licença anual barata e questionário pronto, enquanto diagnóstico de cultura sério exige instrumento próprio, amostra estratificada e equipe que faz devolutiva por nível hierárquico. A área de RH oferece o que tem na prateleira, e a área de SST aceita por restrição de verba — só que o custo verdadeiro aparece dezoito meses depois, na primeira fatalidade que o instrumento deveria ter sinalizado e não sinalizou.
1. Instrumento adaptado de pesquisa de clima de RH
A primeira falha aparece logo no questionário. A empresa contrata uma plataforma de engagement com perguntas como "Você se sente seguro no seu ambiente de trabalho?" ou "A liderança se preocupa com sua segurança?", troca duas ou três palavras e chama o resultado de diagnóstico de cultura. O instrumento mede satisfação difusa, e não comportamento de risco.
Em A Ilusão da Conformidade, Andreza Araujo argumenta que medir sentimento sobre segurança é equivalente a medir sentimento sobre conformidade: produz documento que sustenta a auditoria, ainda que não capture o que o operador faria diante de uma permissão de trabalho mal preenchida na próxima quarta-feira. Um instrumento sério precisa de dimensões específicas, entre elas percepção de risco da tarefa, comportamento observável da liderança em campo, qualidade do reporte de quase-acidente, tratamento de erro, percepção de pressão de produção sobre a segurança e disposição para recusar tarefa.
Quando a operação avalia o instrumento antes de contratar, a pergunta de triagem é direta, porque o instrumento que falha aqui falha nas seis dimensões seguintes. Pergunte ao fornecedor qual é a base de validação científica do questionário aplicado a contextos industriais, e qual é a referência cruzada entre escore obtido e indicadores leading observados em operações comparáveis. Se a resposta for vaga, o produto é survey de clima maquiado.
2. Amostra que não estratifica por nível hierárquico
A segunda falha mata o diagnóstico antes da análise. A empresa aplica o questionário para todos os funcionários, gera um relatório agregado, e calcula a média geral. Em mais de duzentos e cinquenta projetos acompanhados por Andreza Araujo, esse formato omite o achado mais valioso, que é o gap entre a percepção declarada pela diretoria e a percepção real do operador na ponta.
O modelo Hudson sustenta que cultura de segurança se descreve por estágios, e cada estágio convive na mesma organização em níveis diferentes — um C-level pode operar em modo proativo enquanto o supervisor de turno opera em modo calculativo e o operador da ponta vive em modo reativo. Relatório agregado funde esses três estágios numa média ilusória, que pinta uma cultura calculativa onde existem na verdade três culturas em rota de colisão.
O instrumento sério estratifica a amostra por pelo menos quatro níveis, sendo eles operação, supervisão, gerência e diretoria, e cruza por unidade, turno e tempo de casa. A taxa de resposta mínima por estrato é de setenta por cento, sob pena de o estrato pior representado distorcer a leitura — e o pior representado costuma ser o operador da ponta, que é justamente o que carrega o risco de fatalidade. Em operações em que metade das horas trabalhadas é executada por contratada, a estratificação tem de cobrir cultura de segurança em terceirizadas em paralelo com o quadro próprio, ou a maturidade do operador da ponta fica oculta na média global.
3. Perguntas sobre sentimento, não sobre comportamento observável
A terceira falha está na natureza da pergunta. Questionário que opera apenas com escala likert de "concordo plenamente" a "discordo plenamente" mede percepção subjetiva, ao passo que cultura de segurança se manifesta em comportamento observável. Daniel Kahneman descreve em Pensar, Rápido e Devagar o quanto a percepção sobre uma situação se descola da ação efetiva diante dela. A literatura de SST acumula casos em que a equipe declarava cultura forte na pesquisa, ainda que recusas de tarefa, reportes de quase-acidente e desvios estivessem em zero por três trimestres seguidos.
O instrumento sério substitui a pergunta de sentimento pela pergunta de comportamento ocorrido. Em vez de "você se sente seguro", a pergunta passa a ser "nos últimos trinta dias, quantas vezes você recusou uma tarefa por avaliar que o risco não estava controlado". Em vez de "a liderança se preocupa com segurança", a pergunta vira "nos últimos trinta dias, quantas vezes você viu o gerente de planta interromper uma operação por desvio de risco". Comportamento mensurado é a única âncora confiável em diagnóstico cultural, porque o sujeito tem dificuldade de inflar uma contagem objetiva.
4. Devolutiva agregada que esconde conflito entre níveis
A quarta falha aparece quando o relatório chega. Mesmo quando a amostra foi estratificada, a apresentação para o C-level costuma sintetizar tudo em três indicadores agregados e um gráfico de radar com a média global, em nome da legibilidade executiva. O efeito é o oposto do desejado, porque a média global esconde o gap entre estratos, justamente o achado que precisaria pautar a decisão.
Em projetos acompanhados por Andreza Araujo, o gap típico entre a percepção de C-level e a percepção do operador da ponta supera 30 pontos em escala de 100, e relatório agregado torna esse abismo invisível. A devolutiva séria apresenta os escores por estrato lado a lado, identifica as três dimensões com maior gap entre níveis, e organiza um workshop estruturado em que diretoria e operação discutem o achado com mediação. Sem essa etapa, a diretoria mantém a versão otimista da cultura própria, e a operação mantém a leitura cínica de que ninguém na cúpula entende o que acontece no chão.
5. Plano de ação genérico ("treinar todos")
A quinta falha transforma o diagnóstico em peso morto. A empresa recebe um relatório de oitenta páginas, lê o resumo executivo, e converte tudo num plano de ação que cabe em três palavras: SIPAT temática, treinamento renovado e campanha de comunicação. Treinar não muda comportamento de risco quando o fluxo da tarefa, a métrica do supervisor e o sistema de reconhecimento permanecem intactos.
Como Andreza Araujo defende em A Ilusão da Conformidade, comportamento se altera quando a engenharia da operação se altera. Em termos práticos, isso significa mudar o jeito de fazer a tarefa, cobrar o supervisor por indicador leading em vez de TRIR, e converter o reporte de quase-acidente em critério de bônus, e não em fonte de punição informal. Plano de ação sério mapeia cada falha do diagnóstico em uma ação específica, em uma área específica, com um responsável nominal e um indicador leading conectado, e descarta intervenções genéricas como única resposta a um problema sistêmico.
6. Diagnóstico desconectado de indicador leading
A sexta falha condena o ciclo seguinte. O diagnóstico aponta para fragilidade na percepção de risco e no reporte de quase-acidente, embora a empresa siga monitorando apenas TRIR, LTIFR e taxa de severidade nos doze meses posteriores. Indicadores leading são justamente o termômetro que mexe primeiro quando cultura mexe, ao passo que indicadores lagging variam com lentidão e ruído estatístico que mascaram a transformação real.
Diagnóstico sério acompanha indicadores leading conectados às dimensões avaliadas. A lista típica cobre sete medidas:
- taxa de quase-acidente reportado por trabalhador-mês;
- tempo médio de preenchimento de permissão de trabalho;
- percentual de PT recusada pela supervisão;
- percentual de observações comportamentais positivas;
- taxa de retorno dado em campo após observação comportamental;
- percentual de incidentes investigados com plano de ação implementado em sessenta dias;
- percentual de reuniões de início de turno com pauta de risco específica do dia.
Cada falha do diagnóstico mapeia em pelo menos um desses indicadores, e o painel passa a ser revisado mensalmente pelo gerente de operação.
7. Diagnóstico sem ciclo de revisão
A sétima falha encerra a fila. A empresa aplica o diagnóstico, recebe o relatório, executa o plano de ação, e arquiva o instrumento por três anos como se cultura fosse certificação ISO renovada por triênio. Cultura de segurança é dinâmica, embora muitas operações tratem o tema como entrega estática, porque turnover de liderança operacional, fusão e aquisição, mudança de plataforma tecnológica e troca de gerente de planta alteram a cultura em meses.
O ciclo sério aplica o diagnóstico completo a cada doze ou dezoito meses, conforme a estabilidade da operação, e cobre o intervalo com pulse survey trimestral aplicado em amostra rotativa de quinze a vinte por cento dos colaboradores. Esse formato detecta deriva cultural cedo, principalmente após eventos disruptivos como o desligamento de um líder calculativo, a integração de uma planta recém-adquirida ou a virada para um novo modelo de PGR exigido pela NR-01 com auditoria 100% no papel.
Comparação: diagnóstico cultural, pesquisa de clima e NPS de segurança
| Dimensão | Diagnóstico cultural | Pesquisa de clima | NPS de segurança |
|---|---|---|---|
| Foco da medida | risco específico de SST e comportamento | satisfação geral com a empresa | recomendação binária |
| Amostra | estratificada por nível, unidade e turno | total agregado | quem aceitar responder |
| Tipo de pergunta dominante | comportamento ocorrido nos últimos 30 dias | concordância com afirmação genérica | nota única de zero a dez |
| Devolutiva | por estrato, com workshop de discussão | relatório agregado para o C-level | número único compartilhado em SIPAT |
| Tempo típico de aplicação | quarenta e cinco a noventa dias | duas semanas | minutos |
| Plano de ação derivável | específico, com responsável e indicador leading | genérico, escala difusa | nenhum derivável |
| Ciclo de revisão recomendado | doze a dezoito meses, com pulse trimestral | anual ou bianual | contínuo, baixíssimo sinal |
| Capacidade de antecipar SIF | alta quando integrado a indicadores leading | baixa | nula |
O recorte que muda na prática
O diagnóstico de cultura de segurança serve quando a operação aceita ouvir o gap entre o que a diretoria acredita e o que o operador vivencia, e quando converte esse gap em ação operacional concreta. Sem essa disposição, qualquer instrumento aplicado vira ritual de conformidade, ainda que conduzido por consultoria respeitada e relatório encadernado em couro. A pergunta inicial do gerente de operação antes de contratar o próximo diagnóstico não é sobre preço. Ela é sobre o quanto a diretoria está disposta a ver, na devolutiva, que a meta de zero acidentes assinada na sala do conselho coexiste com subnotificação consistente em três das quatro plantas avaliadas.
Cada trimestre adiando o diagnóstico estruturado mantém invisível um gap cultural cujo desfecho típico, na operação industrial brasileira, é a primeira fatalidade investigada como evento isolado, ainda que o sinal estivesse disponível dezoito meses antes em qualquer pulse survey trimestral aplicado com critério.
Conclusão
Diagnóstico de cultura de segurança custa caro quando feito por método sério, embora custe menos do que o resultado da primeira fatalidade evitável que o instrumento medíocre não detectou. A consultoria de Andreza Araujo aplica o método descrito em Diagnóstico de Cultura de Segurança em operações industriais, agrícolas e de mineração, com instrumento próprio, estratificação completa, devolutiva por nível e plano de ação conectado a indicadores leading auditáveis.
Perguntas frequentes
Qual a diferença entre diagnóstico de cultura de segurança e pesquisa de clima organizacional?
Quanto tempo leva um diagnóstico de cultura de segurança bem feito?
Quantas pessoas precisam responder para o diagnóstico ser válido?
Pesquisa de clima com pergunta sobre segurança serve como diagnóstico cultural?
Quando contratar diagnóstico de cultura de segurança em vez de fazer internamente?
Sobre o autor
Especialista em EHS e Cultura de Segurança
Referência em EHS e Cultura de Segurança no Brasil e na América Latina, com 24+ anos liderando segurança em multinacionais como Votorantim Cimentos, Unilever e PepsiCo. Reduziu 86% da taxa de acidentes na PepsiCo LatAm e impactou mais de 100 mil pessoas em 47 países. Engenheira civil e de segurança do trabalho pela Unicamp, mestre em Diplomacia Ambiental pela Universidade de Genebra. Autora de mais de 15 livros sobre cultura de segurança, liderança e percepção de risco.
- 24+ anos liderando EHS em multinacionais (Votorantim Cimentos, Unilever, PepsiCo)
- Engenheira de Segurança do Trabalho — Unicamp; Mestre em Diplomacia Ambiental — Universidade de Genebra
- Autora de 15+ livros sobre cultura de segurança e liderança
- Premiada 2× pela CEO da PepsiCo; 10+ prêmios na área de EHS
andrezaaraujo.com LinkedIn YouTube YouTube open.spotify.com Instagram