15 de mai. de 2026 · risco médio · primeira versão

agent-safety-boundaries

Skill para definir confirmação, zonas de risco e regra de parada antes de dar ferramenta, arquivo ou terminal a um agente.

Entender antes de copiar Ver texto copiável Baixar Markdown

antes de delegar

Antes de copiar, confira se a tarefa cabe neste procedimento.

Use esta parte para decidir com calma: caso indicado, risco, limites e verificações. Se a tarefa tocar cliente, produção, pagamento, segredo ou publicação, a confirmação humana vem antes da execução.

serve quando

Quando usar

Definir limites operacionais para um agente antes de permitir leitura, escrita, terminal, publicação ou acesso externo.

limite humano

Não deixe o agente fazer isso

Apagar, mover ou sobrescrever arquivos em massa sem confirmação.
Ler ou exibir .env, token, chave, senha ou dado de cliente.
Publicar, enviar mensagem externa, aprovar PR, fazer merge ou deploy sozinho.

compatibilidade

Agentes compatíveis

Hermes Agent
Claude Code
Codex
agente Markdown genérico

pré-requisito

Ferramentas necessárias

leitura de contexto
editor de arquivo
terminal quando autorizado
navegador quando autorizado

risco

Risco médio

Pode mexer com ferramenta, arquivo, terminal ou conta. Peça plano, escopo e evidência antes de executar.

verificação

Regras de parada

Não peça nem exponha segredos, tokens, senhas ou dados de cliente no prompt.
Não permita publicação, deploy, merge, exclusão em massa ou mensagem externa sem confirmação humana.
Quando a ação tocar produção, cliente, pagamento ou credencial, pare e peça decisão humana.

checklist de decisão

Antes de rodar, responda este filtro.

A página já organiza zonas de risco, ações proibidas e regra de parada; checklist é mais útil que um diagrama separado.

Caso: a tarefa combina com “quando usar” ou está pedindo outra coisa?
Risco: há produção, cliente, pagamento, segredo, publicação ou exclusão?
Escopo: quais arquivos, contas, comandos ou mensagens estão liberados?
Parada: quando o agente deve recusar e devolver a decisão para humano?
Evidência: qual log, diff, link, teste ou resumo prova que terminou?

instrução copiável

Texto copiável para o agente.

Copie daqui quando o escopo já estiver claro. Se a tarefa tocar produção, cliente, pagamento, segredo ou publicação, pare e peça confirmação humana antes de executar.

Skill: agent-safety-boundaries

Use esta skill quando uma pessoa quiser dar acesso de ferramenta, arquivo, terminal, navegador ou publicação a um agente. Crie os limites antes da execução, não depois do susto.

Agentes compatíveis

Hermes Agent: use com ferramentas locais, browser, terminal, cron e gateway.
Claude Code: use antes de permitir edição em repositório, comando ou PR.
Codex: use antes de tarefas com diff, teste, branch e commit.
Agente Markdown genérico: copie como política de trabalho e peça confirmação textual.

Risco

Risco médio. Vira alto se a próxima ação envolve produção, credencial, cliente, pagamento, deploy, mensagem externa ou exclusão em massa.

Passos

Reescreva a tarefa em uma frase concreta.
Classifique a ação como verde, amarela ou vermelha.
Nomeie o escopo permitido: pasta, repo, sistema, URL ou arquivo.
Nomeie o que fica fora do escopo.
Exija plano e verificação para ações amarelas.
Bloqueie ações vermelhas até confirmação humana explícita.
Antes de executar, diga: vou fazer, vou mexer em, risco, verificação e não vou fazer.
Depois de executar, reporte evidência: diff, log, arquivo criado, teste, link ou resumo.

Zonas de risco

Zona	Pode fazer?	Exemplos
Verde	pode executar e mostrar	ler, resumir, listar, criar rascunho novo
Amarela	precisa explicar plano	editar, mover, instalar, rodar script, alterar config local
Vermelha	não fazer sozinho	apagar em massa, publicar, deploy, segredo, cliente, dinheiro, produção

Não deixe o agente fazer isso

Apagar, mover ou sobrescrever em massa sem confirmação.
Ler ou exibir .env, token, chave, senha ou segredo.
Publicar, enviar mensagem externa, aprovar PR, fazer merge ou deploy sozinho.
Usar conta pessoal/financeira/produção como área de teste.
Continuar quando o contexto contradiz a instrução.

Verificação final

No fechamento, inclua escopo, risco, ações feitas, ações recusadas, evidência e próximo passo humano se houver risco residual.

Checklist visual

1. O objetivo está claro?Se a tarefa não cabe em uma frase, ainda é cedo para entregar ao agente.

2. O acesso mínimo está definido?Comece com leitura e tarefa pequena antes de liberar escrita ou ação externa.

3. Existe parada humana?Produção, segredo, cliente, pagamento, publicação e exclusão pedem confirmação.

4. Existe verificação?Sem comando, evidência ou checklist final, o resultado fica impossível de confiar.

O que executar agora

Abra o template relacionado para preencher a decisão antes de pedir execução. Para entender a decisão por trás do procedimento, leia o guia ligado a esta skill ou a série Playbooks de operação com agentes.

Vídeo

Ainda não há vídeo bom para este caso. Não é promessa. Uma demonstração útil precisa mostrar configuração, limite de ação e verificação final sem vender autonomia mágica.

## Skill: agent-safety-boundaries

Use esta skill quando uma pessoa quiser dar acesso de ferramenta, arquivo, terminal, navegador ou publicação a um agente. Crie os limites antes da execução, não depois do susto.

### Agentes compatíveis

- Hermes Agent: use com ferramentas locais, browser, terminal, cron e gateway.
- Claude Code: use antes de permitir edição em repositório, comando ou PR.
- Codex: use antes de tarefas com diff, teste, branch e commit.
- Agente Markdown genérico: copie como política de trabalho e peça confirmação textual.

### Risco

Risco médio. Vira alto se a próxima ação envolve produção, credencial, cliente, pagamento, deploy, mensagem externa ou exclusão em massa.

### Passos

1. Reescreva a tarefa em uma frase concreta.
2. Classifique a ação como verde, amarela ou vermelha.
3. Nomeie o escopo permitido: pasta, repo, sistema, URL ou arquivo.
4. Nomeie o que fica fora do escopo.
5. Exija plano e verificação para ações amarelas.
6. Bloqueie ações vermelhas até confirmação humana explícita.
7. Antes de executar, diga: vou fazer, vou mexer em, risco, verificação e não vou fazer.
8. Depois de executar, reporte evidência: diff, log, arquivo criado, teste, link ou resumo.

### Zonas de risco

| Zona | Pode fazer? | Exemplos |
|---|---|---|
| Verde | pode executar e mostrar | ler, resumir, listar, criar rascunho novo |
| Amarela | precisa explicar plano | editar, mover, instalar, rodar script, alterar config local |
| Vermelha | não fazer sozinho | apagar em massa, publicar, deploy, segredo, cliente, dinheiro, produção |

### Não deixe o agente fazer isso

- Apagar, mover ou sobrescrever em massa sem confirmação.
- Ler ou exibir `.env`, token, chave, senha ou segredo.
- Publicar, enviar mensagem externa, aprovar PR, fazer merge ou deploy sozinho.
- Usar conta pessoal/financeira/produção como área de teste.
- Continuar quando o contexto contradiz a instrução.

### Verificação final

No fechamento, inclua escopo, risco, ações feitas, ações recusadas, evidência e próximo passo humano se houver risco residual.
### Checklist visual

<div class="decision-flow" aria-label="Checklist para limite de acesso">
  <div><strong>1. O objetivo está claro?</strong><span>Se a tarefa não cabe em uma frase, ainda é cedo para entregar ao agente.</span></div>
  <div><strong>2. O acesso mínimo está definido?</strong><span>Comece com leitura e tarefa pequena antes de liberar escrita ou ação externa.</span></div>
  <div><strong>3. Existe parada humana?</strong><span>Produção, segredo, cliente, pagamento, publicação e exclusão pedem confirmação.</span></div>
  <div><strong>4. Existe verificação?</strong><span>Sem comando, evidência ou checklist final, o resultado fica impossível de confiar.</span></div>
</div>

### O que executar agora

Abra o [template relacionado](/templates/agent-safety-boundaries/) para preencher a decisão antes de pedir execução. Para entender a decisão por trás do procedimento, leia [o guia ligado a esta skill](/agentes/seguranca-agente-pessoal-acesso-arquivos/) ou a série [Playbooks de operação com agentes](/guias/playbooks-operacao-com-agentes/).

### Vídeo

Ainda não há vídeo bom para este caso. Não é promessa. Uma demonstração útil precisa mostrar configuração, limite de ação e verificação final sem vender autonomia mágica.

Antes de copiar, confira se a tarefa cabe neste procedimento.

Quando usar

Não deixe o agente fazer isso

Agentes compatíveis

Ferramentas necessárias

Risco médio

Regras de parada

Antes de rodar, responda este filtro.

Se o escopo ainda está nebuloso, volte para o guia ou para o template.

Continue por páginas próximas.

Texto copiável para o agente.

Skill: agent-safety-boundaries

Agentes compatíveis

Risco

Passos

Zonas de risco

Não deixe o agente fazer isso

Verificação final

Checklist visual

O que executar agora

Vídeo