Blog Loja Andreza Araujo
Cultura de Segurança

Diagnóstico de cultura de segurança: 7 falhas que tornam o instrumento inútil

Sete falhas recorrentes transformam o diagnóstico de cultura em pesquisa de clima de RH disfarçada, e produzem relatório bonito sem capacidade de mover o risco real

Por Publicado em 10 min de leitura Atualizado em
ambiente corporativo retratando diagnostico de cultura de seguranca 7 falhas que tornam o instrumento inutil — Diagnóstico de

Principais conclusões

  1. 01Recuse instrumento de diagnóstico cultural cujo questionário foi adaptado de pesquisa de clima de RH, porque medir sentimento sobre segurança não é equivalente a medir comportamento de risco observável.
  2. 02Estratifique a amostra por pelo menos quatro níveis hierárquicos, já que o gap entre a percepção da diretoria e a percepção do operador da ponta supera 30 pontos na maioria das operações industriais.
  3. 03Substitua perguntas sobre sentimento ("você se sente seguro") por perguntas sobre comportamento ocorrido ("quantas vezes recusou tarefa por risco nos últimos 30 dias"), porque comportamento mensurado é a única âncora confiável.
  4. 04Apresente devolutiva por estrato em vez de média global, porque o achado mais valioso de qualquer diagnóstico cultural é o gap entre o que a cúpula acredita e o que a operação vivencia, e a média esconde esse abismo.
  5. 05Contrate o Diagnóstico de Cultura de Segurança com a consultoria de Andreza Araujo quando a operação chegou a 200 funcionários ou cresceu por aquisição nos últimos 24 meses, e o painel atual ainda depende exclusivamente de TRIR para sinalizar risco cultural.

Diagnóstico de cultura de segurança virou rótulo. Em mais de 250 projetos de transformação cultural acompanhados por Andreza Araujo, o instrumento aplicado pela maioria das empresas era pesquisa de clima de RH com cinco perguntas reescritas. O resultado tende a se repetir em quase todos os casos: relatório agradável de ler, plano de ação inviável, e indicador leading que não se move nos vinte e quatro meses seguintes. Este artigo descreve as sete falhas estruturais que separam um diagnóstico capaz de mexer com SIF de um questionário de satisfação fantasiado de método.

Por que pesquisa de clima virou substituto barato do diagnóstico

A confusão entre diagnóstico de cultura de segurança e pesquisa de clima organizacional é a primeira armadilha, porque os dois instrumentos respondem a perguntas diferentes. A pesquisa de clima mede o quanto o funcionário está satisfeito com a empresa, ao passo que o diagnóstico de cultura mede o quanto a operação tolera desvio, recusa de tarefa, reporte de quase-acidente e questionamento da liderança. Como Andreza Araujo defende em Diagnóstico de Cultura de Segurança, esses são objetos distintos, e qualquer instrumento que confunde um com o outro entrega uma fotografia sem foco.

O segundo motivo da popularidade do atalho é orçamentário. Pesquisa de clima é commodity de mercado, com licença anual barata e questionário pronto, enquanto diagnóstico de cultura sério exige instrumento próprio, amostra estratificada e equipe que faz devolutiva por nível hierárquico. A área de RH oferece o que tem na prateleira, e a área de SST aceita por restrição de verba — só que o custo verdadeiro aparece dezoito meses depois, na primeira fatalidade que o instrumento deveria ter sinalizado e não sinalizou.

1. Instrumento adaptado de pesquisa de clima de RH

A primeira falha aparece logo no questionário. A empresa contrata uma plataforma de engagement com perguntas como "Você se sente seguro no seu ambiente de trabalho?" ou "A liderança se preocupa com sua segurança?", troca duas ou três palavras e chama o resultado de diagnóstico de cultura. O instrumento mede satisfação difusa, e não comportamento de risco.

Em A Ilusão da Conformidade, Andreza Araujo argumenta que medir sentimento sobre segurança é equivalente a medir sentimento sobre conformidade: produz documento que sustenta a auditoria, ainda que não capture o que o operador faria diante de uma permissão de trabalho mal preenchida na próxima quarta-feira. Um instrumento sério precisa de dimensões específicas, entre elas percepção de risco da tarefa, comportamento observável da liderança em campo, qualidade do reporte de quase-acidente, tratamento de erro, percepção de pressão de produção sobre a segurança e disposição para recusar tarefa.

Quando a operação avalia o instrumento antes de contratar, a pergunta de triagem é direta, porque o instrumento que falha aqui falha nas seis dimensões seguintes. Pergunte ao fornecedor qual é a base de validação científica do questionário aplicado a contextos industriais, e qual é a referência cruzada entre escore obtido e indicadores leading observados em operações comparáveis. Se a resposta for vaga, o produto é survey de clima maquiado.

2. Amostra que não estratifica por nível hierárquico

A segunda falha mata o diagnóstico antes da análise. A empresa aplica o questionário para todos os funcionários, gera um relatório agregado, e calcula a média geral. Em mais de duzentos e cinquenta projetos acompanhados por Andreza Araujo, esse formato omite o achado mais valioso, que é o gap entre a percepção declarada pela diretoria e a percepção real do operador na ponta.

O modelo Hudson sustenta que cultura de segurança se descreve por estágios, e cada estágio convive na mesma organização em níveis diferentes — um C-level pode operar em modo proativo enquanto o supervisor de turno opera em modo calculativo e o operador da ponta vive em modo reativo. Relatório agregado funde esses três estágios numa média ilusória, que pinta uma cultura calculativa onde existem na verdade três culturas em rota de colisão.

O instrumento sério estratifica a amostra por pelo menos quatro níveis, sendo eles operação, supervisão, gerência e diretoria, e cruza por unidade, turno e tempo de casa. A taxa de resposta mínima por estrato é de setenta por cento, sob pena de o estrato pior representado distorcer a leitura — e o pior representado costuma ser o operador da ponta, que é justamente o que carrega o risco de fatalidade. Em operações em que metade das horas trabalhadas é executada por contratada, a estratificação tem de cobrir cultura de segurança em terceirizadas em paralelo com o quadro próprio, ou a maturidade do operador da ponta fica oculta na média global.

3. Perguntas sobre sentimento, não sobre comportamento observável

A terceira falha está na natureza da pergunta. Questionário que opera apenas com escala likert de "concordo plenamente" a "discordo plenamente" mede percepção subjetiva, ao passo que cultura de segurança se manifesta em comportamento observável. Daniel Kahneman descreve em Pensar, Rápido e Devagar o quanto a percepção sobre uma situação se descola da ação efetiva diante dela. A literatura de SST acumula casos em que a equipe declarava cultura forte na pesquisa, ainda que recusas de tarefa, reportes de quase-acidente e desvios estivessem em zero por três trimestres seguidos.

O instrumento sério substitui a pergunta de sentimento pela pergunta de comportamento ocorrido. Em vez de "você se sente seguro", a pergunta passa a ser "nos últimos trinta dias, quantas vezes você recusou uma tarefa por avaliar que o risco não estava controlado". Em vez de "a liderança se preocupa com segurança", a pergunta vira "nos últimos trinta dias, quantas vezes você viu o gerente de planta interromper uma operação por desvio de risco". Comportamento mensurado é a única âncora confiável em diagnóstico cultural, porque o sujeito tem dificuldade de inflar uma contagem objetiva.

4. Devolutiva agregada que esconde conflito entre níveis

A quarta falha aparece quando o relatório chega. Mesmo quando a amostra foi estratificada, a apresentação para o C-level costuma sintetizar tudo em três indicadores agregados e um gráfico de radar com a média global, em nome da legibilidade executiva. O efeito é o oposto do desejado, porque a média global esconde o gap entre estratos, justamente o achado que precisaria pautar a decisão.

Em projetos acompanhados por Andreza Araujo, o gap típico entre a percepção de C-level e a percepção do operador da ponta supera 30 pontos em escala de 100, e relatório agregado torna esse abismo invisível. A devolutiva séria apresenta os escores por estrato lado a lado, identifica as três dimensões com maior gap entre níveis, e organiza um workshop estruturado em que diretoria e operação discutem o achado com mediação. Sem essa etapa, a diretoria mantém a versão otimista da cultura própria, e a operação mantém a leitura cínica de que ninguém na cúpula entende o que acontece no chão.

5. Plano de ação genérico ("treinar todos")

A quinta falha transforma o diagnóstico em peso morto. A empresa recebe um relatório de oitenta páginas, lê o resumo executivo, e converte tudo num plano de ação que cabe em três palavras: SIPAT temática, treinamento renovado e campanha de comunicação. Treinar não muda comportamento de risco quando o fluxo da tarefa, a métrica do supervisor e o sistema de reconhecimento permanecem intactos.

Como Andreza Araujo defende em A Ilusão da Conformidade, comportamento se altera quando a engenharia da operação se altera. Em termos práticos, isso significa mudar o jeito de fazer a tarefa, cobrar o supervisor por indicador leading em vez de TRIR, e converter o reporte de quase-acidente em critério de bônus, e não em fonte de punição informal. Plano de ação sério mapeia cada falha do diagnóstico em uma ação específica, em uma área específica, com um responsável nominal e um indicador leading conectado, e descarta intervenções genéricas como única resposta a um problema sistêmico.

6. Diagnóstico desconectado de indicador leading

A sexta falha condena o ciclo seguinte. O diagnóstico aponta para fragilidade na percepção de risco e no reporte de quase-acidente, embora a empresa siga monitorando apenas TRIR, LTIFR e taxa de severidade nos doze meses posteriores. Indicadores leading são justamente o termômetro que mexe primeiro quando cultura mexe, ao passo que indicadores lagging variam com lentidão e ruído estatístico que mascaram a transformação real.

Diagnóstico sério acompanha indicadores leading conectados às dimensões avaliadas. A lista típica cobre sete medidas:

  • taxa de quase-acidente reportado por trabalhador-mês;
  • tempo médio de preenchimento de permissão de trabalho;
  • percentual de PT recusada pela supervisão;
  • percentual de observações comportamentais positivas;
  • taxa de retorno dado em campo após observação comportamental;
  • percentual de incidentes investigados com plano de ação implementado em sessenta dias;
  • percentual de reuniões de início de turno com pauta de risco específica do dia.

Cada falha do diagnóstico mapeia em pelo menos um desses indicadores, e o painel passa a ser revisado mensalmente pelo gerente de operação.

7. Diagnóstico sem ciclo de revisão

A sétima falha encerra a fila. A empresa aplica o diagnóstico, recebe o relatório, executa o plano de ação, e arquiva o instrumento por três anos como se cultura fosse certificação ISO renovada por triênio. Cultura de segurança é dinâmica, embora muitas operações tratem o tema como entrega estática, porque turnover de liderança operacional, fusão e aquisição, mudança de plataforma tecnológica e troca de gerente de planta alteram a cultura em meses.

O ciclo sério aplica o diagnóstico completo a cada doze ou dezoito meses, conforme a estabilidade da operação, e cobre o intervalo com pulse survey trimestral aplicado em amostra rotativa de quinze a vinte por cento dos colaboradores. Esse formato detecta deriva cultural cedo, principalmente após eventos disruptivos como o desligamento de um líder calculativo, a integração de uma planta recém-adquirida ou a virada para um novo modelo de PGR exigido pela NR-01 com auditoria 100% no papel.

Comparação: diagnóstico cultural, pesquisa de clima e NPS de segurança

DimensãoDiagnóstico culturalPesquisa de climaNPS de segurança
Foco da medidarisco específico de SST e comportamentosatisfação geral com a empresarecomendação binária
Amostraestratificada por nível, unidade e turnototal agregadoquem aceitar responder
Tipo de pergunta dominantecomportamento ocorrido nos últimos 30 diasconcordância com afirmação genéricanota única de zero a dez
Devolutivapor estrato, com workshop de discussãorelatório agregado para o C-levelnúmero único compartilhado em SIPAT
Tempo típico de aplicaçãoquarenta e cinco a noventa diasduas semanasminutos
Plano de ação derivávelespecífico, com responsável e indicador leadinggenérico, escala difusanenhum derivável
Ciclo de revisão recomendadodoze a dezoito meses, com pulse trimestralanual ou bianualcontínuo, baixíssimo sinal
Capacidade de antecipar SIFalta quando integrado a indicadores leadingbaixanula

O recorte que muda na prática

O diagnóstico de cultura de segurança serve quando a operação aceita ouvir o gap entre o que a diretoria acredita e o que o operador vivencia, e quando converte esse gap em ação operacional concreta. Sem essa disposição, qualquer instrumento aplicado vira ritual de conformidade, ainda que conduzido por consultoria respeitada e relatório encadernado em couro. A pergunta inicial do gerente de operação antes de contratar o próximo diagnóstico não é sobre preço. Ela é sobre o quanto a diretoria está disposta a ver, na devolutiva, que a meta de zero acidentes assinada na sala do conselho coexiste com subnotificação consistente em três das quatro plantas avaliadas.

Cada trimestre adiando o diagnóstico estruturado mantém invisível um gap cultural cujo desfecho típico, na operação industrial brasileira, é a primeira fatalidade investigada como evento isolado, ainda que o sinal estivesse disponível dezoito meses antes em qualquer pulse survey trimestral aplicado com critério.

Conclusão

Diagnóstico de cultura de segurança custa caro quando feito por método sério, embora custe menos do que o resultado da primeira fatalidade evitável que o instrumento medíocre não detectou. A consultoria de Andreza Araujo aplica o método descrito em Diagnóstico de Cultura de Segurança em operações industriais, agrícolas e de mineração, com instrumento próprio, estratificação completa, devolutiva por nível e plano de ação conectado a indicadores leading auditáveis.

#diagnostico-cultural #cultura-de-seguranca #maturidade-cultural #pesquisa-de-clima #indicadores-leading

Perguntas frequentes

Qual a diferença entre diagnóstico de cultura de segurança e pesquisa de clima organizacional?
Pesquisa de clima mede satisfação geral com a empresa e usa perguntas em escala de concordância sobre afirmações genéricas. Diagnóstico de cultura de segurança mede o quanto a operação tolera desvio, recusa tarefa, reporta quase-acidente e questiona a liderança, e usa perguntas sobre comportamento ocorrido nos últimos trinta dias. São objetos distintos, ainda que muitas plataformas vendam um pelo outro. O livro Diagnóstico de Cultura de Segurança, de Andreza Araujo, descreve as dimensões específicas que o instrumento sério precisa cobrir.
Quanto tempo leva um diagnóstico de cultura de segurança bem feito?
Entre quarenta e cinco e noventa dias, conforme o porte da operação e a complexidade da estratificação. O cronograma típico cobre quinze dias para desenho do instrumento e calibração do questionário, vinte a trinta dias para aplicação distribuída por turnos e unidades, dez a quinze dias para análise estatística com cruzamento por estrato, e quinze a vinte dias para devolutiva conduzida em workshops separados por nível hierárquico. Operações com mais de cinco mil funcionários ou múltiplos sites pedem janela superior.
Quantas pessoas precisam responder para o diagnóstico ser válido?
A taxa de resposta mínima é de setenta por cento por estrato, e não na amostra agregada. Em uma operação com mil colaboradores estratificada em quatro níveis (operação, supervisão, gerência, diretoria), a leitura é confiável quando cada estrato individualmente atinge setenta por cento de resposta. Quando o estrato da operação fica abaixo desse piso, o relatório distorce o achado mais valioso, que é justamente a leitura da ponta, e o diagnóstico precisa ser refeito ou reforçado com entrevistas qualitativas.
Pesquisa de clima com pergunta sobre segurança serve como diagnóstico cultural?
Não. Pergunta isolada sobre segurança dentro de pesquisa de engagement gera um número médio sem capacidade analítica, porque não estratifica por nível, não pergunta sobre comportamento observável, não tem dimensões específicas de risco, e a devolutiva agregada esconde o gap entre cúpula e operação. O instrumento captura sinal de satisfação difusa, e não sinal cultural de risco. Empresa que tenta usar pesquisa de clima como substituto pega economia imediata e paga a conta dezoito meses depois, na primeira fatalidade que o sinal real teria antecipado.
Quando contratar diagnóstico de cultura de segurança em vez de fazer internamente?
A contratação externa se justifica em três cenários. Primeiro, quando a operação passa de duzentos funcionários e o painel de indicadores depende quase exclusivamente de TRIR. Segundo, quando a empresa cresceu por aquisição nos últimos vinte e quatro meses e integra plantas com culturas distintas que ainda não foram lidas. Terceiro, quando o C-level pediu plano de transformação cultural e o time interno de SST não tem instrumento validado nem distância política para apresentar achado desconfortável à diretoria. A consultoria de Andreza Araujo atua especificamente nesses cenários.

Sobre o autor

Especialista em EHS e Cultura de Segurança

Referência em EHS e Cultura de Segurança no Brasil e na América Latina, com 24+ anos liderando segurança em multinacionais como Votorantim Cimentos, Unilever e PepsiCo. Reduziu 86% da taxa de acidentes na PepsiCo LatAm e impactou mais de 100 mil pessoas em 47 países. Engenheira civil e de segurança do trabalho pela Unicamp, mestre em Diplomacia Ambiental pela Universidade de Genebra. Autora de mais de 15 livros sobre cultura de segurança, liderança e percepção de risco.

  • 24+ anos liderando EHS em multinacionais (Votorantim Cimentos, Unilever, PepsiCo)
  • Engenheira de Segurança do Trabalho — Unicamp; Mestre em Diplomacia Ambiental — Universidade de Genebra
  • Autora de 15+ livros sobre cultura de segurança e liderança
  • Premiada 2× pela CEO da PepsiCo; 10+ prêmios na área de EHS

andrezaaraujo.com LinkedIn YouTube YouTube open.spotify.com Instagram

Seguir