15 de mai. de 2026 · risco médio · primeira versão
agent-safety-boundaries
Skill para definir confirmação, zonas de risco e regra de parada antes de dar ferramenta, arquivo ou terminal a um agente.
antes de delegar
Antes de copiar, confira se a tarefa cabe neste procedimento.
Use esta parte para decidir com calma: caso indicado, risco, limites e verificações. Se a tarefa tocar cliente, produção, pagamento, segredo ou publicação, a confirmação humana vem antes da execução.
Quando usar
Definir limites operacionais para um agente antes de permitir leitura, escrita, terminal, publicação ou acesso externo.
Não deixe o agente fazer isso
- Apagar, mover ou sobrescrever arquivos em massa sem confirmação.
- Ler ou exibir .env, token, chave, senha ou dado de cliente.
- Publicar, enviar mensagem externa, aprovar PR, fazer merge ou deploy sozinho.
Agentes compatíveis
- Hermes Agent
- Claude Code
- Codex
- agente Markdown genérico
Ferramentas necessárias
- leitura de contexto
- editor de arquivo
- terminal quando autorizado
- navegador quando autorizado
Risco médio
Pode mexer com ferramenta, arquivo, terminal ou conta. Peça plano, escopo e evidência antes de executar.
Regras de parada
- Não peça nem exponha segredos, tokens, senhas ou dados de cliente no prompt.
- Não permita publicação, deploy, merge, exclusão em massa ou mensagem externa sem confirmação humana.
- Quando a ação tocar produção, cliente, pagamento ou credencial, pare e peça decisão humana.
checklist de decisão
Antes de rodar, responda este filtro.
A página já organiza zonas de risco, ações proibidas e regra de parada; checklist é mais útil que um diagrama separado.
- Caso: a tarefa combina com “quando usar” ou está pedindo outra coisa?
- Risco: há produção, cliente, pagamento, segredo, publicação ou exclusão?
- Escopo: quais arquivos, contas, comandos ou mensagens estão liberados?
- Parada: quando o agente deve recusar e devolver a decisão para humano?
- Evidência: qual log, diff, link, teste ou resumo prova que terminou?
instrução copiável
Texto copiável para o agente.
Copie daqui quando o escopo já estiver claro. Se a tarefa tocar produção, cliente, pagamento, segredo ou publicação, pare e peça confirmação humana antes de executar.
Skill: agent-safety-boundaries
Use esta skill quando uma pessoa quiser dar acesso de ferramenta, arquivo, terminal, navegador ou publicação a um agente. Crie os limites antes da execução, não depois do susto.
Agentes compatíveis
- Hermes Agent: use com ferramentas locais, browser, terminal, cron e gateway.
- Claude Code: use antes de permitir edição em repositório, comando ou PR.
- Codex: use antes de tarefas com diff, teste, branch e commit.
- Agente Markdown genérico: copie como política de trabalho e peça confirmação textual.
Risco
Risco médio. Vira alto se a próxima ação envolve produção, credencial, cliente, pagamento, deploy, mensagem externa ou exclusão em massa.
Passos
- Reescreva a tarefa em uma frase concreta.
- Classifique a ação como verde, amarela ou vermelha.
- Nomeie o escopo permitido: pasta, repo, sistema, URL ou arquivo.
- Nomeie o que fica fora do escopo.
- Exija plano e verificação para ações amarelas.
- Bloqueie ações vermelhas até confirmação humana explícita.
- Antes de executar, diga: vou fazer, vou mexer em, risco, verificação e não vou fazer.
- Depois de executar, reporte evidência: diff, log, arquivo criado, teste, link ou resumo.
Zonas de risco
| Zona | Pode fazer? | Exemplos |
|---|---|---|
| Verde | pode executar e mostrar | ler, resumir, listar, criar rascunho novo |
| Amarela | precisa explicar plano | editar, mover, instalar, rodar script, alterar config local |
| Vermelha | não fazer sozinho | apagar em massa, publicar, deploy, segredo, cliente, dinheiro, produção |
Não deixe o agente fazer isso
- Apagar, mover ou sobrescrever em massa sem confirmação.
- Ler ou exibir
.env, token, chave, senha ou segredo. - Publicar, enviar mensagem externa, aprovar PR, fazer merge ou deploy sozinho.
- Usar conta pessoal/financeira/produção como área de teste.
- Continuar quando o contexto contradiz a instrução.
Verificação final
No fechamento, inclua escopo, risco, ações feitas, ações recusadas, evidência e próximo passo humano se houver risco residual.
Checklist visual
O que executar agora
Abra o template relacionado para preencher a decisão antes de pedir execução. Para entender a decisão por trás do procedimento, leia o guia ligado a esta skill ou a série Playbooks de operação com agentes.
Vídeo
Ainda não há vídeo bom para este caso. Não é promessa. Uma demonstração útil precisa mostrar configuração, limite de ação e verificação final sem vender autonomia mágica.