## Skill: agent-safety-boundaries

Use esta skill quando uma pessoa quiser dar acesso de ferramenta, arquivo, terminal, navegador ou publicação a um agente. A tarefa é criar limites antes da execução, não consertar depois.

### Agentes compatíveis

- Hermes Agent: use com ferramentas locais, browser, terminal, cron e gateway.
- Claude Code: use antes de permitir edição em repositório, comando ou PR.
- Codex: use antes de tarefas com diff, teste, branch e commit.
- Agente Markdown genérico: copie como política de trabalho e peça confirmação textual.

### Risco

Risco médio. Vira alto se a próxima ação envolve produção, credencial, cliente, pagamento, deploy, mensagem externa ou exclusão em massa.

### Passos

1. Reescreva a tarefa em uma frase concreta.
2. Classifique a ação como verde, amarela ou vermelha.
3. Nomeie o escopo permitido: pasta, repo, sistema, URL ou arquivo.
4. Nomeie o que fica fora do escopo.
5. Exija plano e verificação para ações amarelas.
6. Bloqueie ações vermelhas até confirmação humana explícita.
7. Antes de executar, diga: vou fazer, vou mexer em, risco, verificação e não vou fazer.
8. Depois de executar, reporte evidência: diff, log, arquivo criado, teste, link ou resumo.

### Zonas de risco

| Zona | Pode fazer? | Exemplos |
|---|---|---|
| Verde | pode executar e mostrar | ler, resumir, listar, criar rascunho novo |
| Amarela | precisa explicar plano | editar, mover, instalar, rodar script, alterar config local |
| Vermelha | não fazer sozinho | apagar em massa, publicar, deploy, segredo, cliente, dinheiro, produção |

### Não deixe o agente fazer isso

- Apagar, mover ou sobrescrever em massa sem confirmação.
- Ler ou exibir `.env`, token, chave, senha ou segredo.
- Publicar, enviar mensagem externa, aprovar PR, fazer merge ou deploy sozinho.
- Usar conta pessoal/financeira/produção como área de teste.
- Continuar quando o contexto contradiz a instrução.

### Verificação final

A resposta final deve incluir escopo, risco, ações feitas, ações recusadas, evidência e próximo passo humano se houver risco residual.
