São Paulo · Brasil skill para agente

15 de mai. de 2026 · risco médio · primeira versão

agent-safety-boundaries

Skill para definir confirmação, zonas de risco e regra de parada antes de dar ferramenta, arquivo ou terminal a um agente.

antes de delegar

Antes de copiar, confira se a tarefa cabe neste procedimento.

Use esta parte para decidir com calma: caso indicado, risco, limites e verificações. Se a tarefa tocar cliente, produção, pagamento, segredo ou publicação, a confirmação humana vem antes da execução.

serve quando

Quando usar

Definir limites operacionais para um agente antes de permitir leitura, escrita, terminal, publicação ou acesso externo.

limite humano

Não deixe o agente fazer isso

  • Apagar, mover ou sobrescrever arquivos em massa sem confirmação.
  • Ler ou exibir .env, token, chave, senha ou dado de cliente.
  • Publicar, enviar mensagem externa, aprovar PR, fazer merge ou deploy sozinho.
compatibilidade

Agentes compatíveis

  • Hermes Agent
  • Claude Code
  • Codex
  • agente Markdown genérico
pré-requisito

Ferramentas necessárias

  • leitura de contexto
  • editor de arquivo
  • terminal quando autorizado
  • navegador quando autorizado
risco

Risco médio

Pode mexer com ferramenta, arquivo, terminal ou conta. Peça plano, escopo e evidência antes de executar.

verificação

Regras de parada

  • Não peça nem exponha segredos, tokens, senhas ou dados de cliente no prompt.
  • Não permita publicação, deploy, merge, exclusão em massa ou mensagem externa sem confirmação humana.
  • Quando a ação tocar produção, cliente, pagamento ou credencial, pare e peça decisão humana.

checklist de decisão

Antes de rodar, responda este filtro.

A página já organiza zonas de risco, ações proibidas e regra de parada; checklist é mais útil que um diagrama separado.

  1. Caso: a tarefa combina com “quando usar” ou está pedindo outra coisa?
  2. Risco: há produção, cliente, pagamento, segredo, publicação ou exclusão?
  3. Escopo: quais arquivos, contas, comandos ou mensagens estão liberados?
  4. Parada: quando o agente deve recusar e devolver a decisão para humano?
  5. Evidência: qual log, diff, link, teste ou resumo prova que terminou?

instrução copiável

Texto copiável para o agente.

Copie daqui quando o escopo já estiver claro. Se a tarefa tocar produção, cliente, pagamento, segredo ou publicação, pare e peça confirmação humana antes de executar.

Skill: agent-safety-boundaries

Use esta skill quando uma pessoa quiser dar acesso de ferramenta, arquivo, terminal, navegador ou publicação a um agente. Crie os limites antes da execução, não depois do susto.

Agentes compatíveis

  • Hermes Agent: use com ferramentas locais, browser, terminal, cron e gateway.
  • Claude Code: use antes de permitir edição em repositório, comando ou PR.
  • Codex: use antes de tarefas com diff, teste, branch e commit.
  • Agente Markdown genérico: copie como política de trabalho e peça confirmação textual.

Risco

Risco médio. Vira alto se a próxima ação envolve produção, credencial, cliente, pagamento, deploy, mensagem externa ou exclusão em massa.

Passos

  1. Reescreva a tarefa em uma frase concreta.
  2. Classifique a ação como verde, amarela ou vermelha.
  3. Nomeie o escopo permitido: pasta, repo, sistema, URL ou arquivo.
  4. Nomeie o que fica fora do escopo.
  5. Exija plano e verificação para ações amarelas.
  6. Bloqueie ações vermelhas até confirmação humana explícita.
  7. Antes de executar, diga: vou fazer, vou mexer em, risco, verificação e não vou fazer.
  8. Depois de executar, reporte evidência: diff, log, arquivo criado, teste, link ou resumo.

Zonas de risco

ZonaPode fazer?Exemplos
Verdepode executar e mostrarler, resumir, listar, criar rascunho novo
Amarelaprecisa explicar planoeditar, mover, instalar, rodar script, alterar config local
Vermelhanão fazer sozinhoapagar em massa, publicar, deploy, segredo, cliente, dinheiro, produção

Não deixe o agente fazer isso

  • Apagar, mover ou sobrescrever em massa sem confirmação.
  • Ler ou exibir .env, token, chave, senha ou segredo.
  • Publicar, enviar mensagem externa, aprovar PR, fazer merge ou deploy sozinho.
  • Usar conta pessoal/financeira/produção como área de teste.
  • Continuar quando o contexto contradiz a instrução.

Verificação final

No fechamento, inclua escopo, risco, ações feitas, ações recusadas, evidência e próximo passo humano se houver risco residual.

Checklist visual

1. O objetivo está claro?Se a tarefa não cabe em uma frase, ainda é cedo para entregar ao agente.
2. O acesso mínimo está definido?Comece com leitura e tarefa pequena antes de liberar escrita ou ação externa.
3. Existe parada humana?Produção, segredo, cliente, pagamento, publicação e exclusão pedem confirmação.
4. Existe verificação?Sem comando, evidência ou checklist final, o resultado fica impossível de confiar.

O que executar agora

Abra o template relacionado para preencher a decisão antes de pedir execução. Para entender a decisão por trás do procedimento, leia o guia ligado a esta skill ou a série Playbooks de operação com agentes.

Vídeo

Ainda não há vídeo bom para este caso. Não é promessa. Uma demonstração útil precisa mostrar configuração, limite de ação e verificação final sem vender autonomia mágica.