15 de mai. de 2026 · guia operacional
Segurança para agente pessoal com arquivos
Limites práticos para deixar um agente ler, escrever e organizar arquivos sem transformar produtividade em risco silencioso.
O problema
Agente com acesso a arquivo é útil. Também é perigoso.
O risco não é só “ele apagar tudo”. O risco comum é menor e mais chato: sobrescrever arquivo certo com conteúdo errado, mover coisa para lugar ruim, vazar segredo em contexto, editar produção sem perceber, instalar pacote desnecessário, ou deixar uma mudança sem rastro.
Segurança aqui não é paranoia. É design de rotina.
Três zonas de acesso
Divida o mundo em três zonas.
quadro de fronteira
Acesso bom tem cerca visível.
Classifique a ação antes de dar ferramenta. Se o pedido encosta em cliente, credencial, dinheiro, produção ou envio externo, ele sobe de risco.
Ler arquivo não sensível, listar pasta, resumir, gerar plano e criar rascunho novo.
Editar, mover, instalar dependência, rodar script ou alterar configuração local.
Apagar em massa, publicar, tocar segredo, mexer em produção ou enviar mensagem externa.
Quando a classificação não é clara, trate como amarela. Se houver dano real, trate como vermelha.
| Zona | O agente pode fazer | Regra |
|---|---|---|
| Verde | ler arquivo não sensível, resumir, listar pasta, gerar plano, criar rascunho novo | pode fazer sozinho e mostrar resultado |
| Amarela | editar arquivo, mover item, instalar dependência, rodar script, alterar configuração local | precisa explicar plano e pedir confirmação |
| Vermelha | apagar em massa, mexer em produção, publicar, enviar mensagem externa, tocar segredo, acessar dado de cliente | bloqueado ou exige aprovação explícita fora do fluxo normal |
Se você não sabe classificar uma ação, trate como amarela. Se envolve cliente, dinheiro, credencial ou produção, trate como vermelha.
Regras mínimas
Escreva algo assim para o agente:
- Pode ler arquivos do projeto atual.
- Pode criar rascunhos novos em pasta combinada.
- Pode propor mudanças antes de aplicar.
- Mostre o diff antes de editar arquivo existente quando a mudança for relevante.
- Deve pedir confirmação antes de apagar, mover, sobrescrever ou instalar.
- Não pode mexer em
.env, tokens, chaves, credenciais ou segredo sem instrução explícita. - Não pode publicar, enviar mensagem externa ou executar deploy sem confirmação.
- Não pode rodar comando destrutivo sem repetir o alvo e o motivo.
- Deve registrar o que mudou e como verificar.
- Deve parar quando encontrar contexto contraditório.
Isso serve para Hermes, Claude Code, Codex ou qualquer agente com ferramenta. A sintaxe muda. A responsabilidade não.
Segredos não entram no prompt
Token colado em chat é vazamento com UX boa.
Segredo deve ficar em arquivo de ambiente, secret manager, variável local ou configuração apropriada. O agente pode saber que existe uma credencial. Ele não precisa ver a credencial inteira para toda tarefa.
Evite:
- mandar
.envinteiro no prompt; - pedir para o agente “guardar” token em memória;
- colar chave de API em issue, PR ou documento;
- dar acesso global quando uma variável específica bastava;
- usar o mesmo token para teste e produção.
No Hermes em VPS, veja o guia de setup e a skill de setup para tratar configuração como arquivo, não como conversa solta.
Confirmação boa não é “posso?”
Confirmação fraca:
Posso fazer isso?
Confirmação boa:
Vou editar
src/pages/agentes/index.astro, trocar a chamada principal e rodarpnpm run build. Não vou mexer em deploy nem apagar arquivos. Confirmar?
A confirmação deve dizer:
- arquivos afetados;
- ação exata;
- risco;
- verificação;
- o que não será feito.
Se o agente não consegue explicar isso, ele ainda não entendeu a tarefa.
Checklist antes de liberar escrita
- O agente sabe qual pasta é segura?
- Existe backup, git ou histórico?
- Arquivos de segredo estão fora do escopo?
- Ações destrutivas exigem confirmação?
- Produção está bloqueada por padrão?
- O agente mostra diff ou resumo de alteração?
- Existe comando de verificação?
- O canal de acesso é privado?
- Você consegue revogar token ou parar processo?
- O primeiro teste altera algo sem importância?
Quando o agente toca cliente
Para arquivos próprios, pasta de teste, confirmação manual e tarefa reversível, o caminho faça você mesmo é suficiente. Não precisa chamar empresa para aprender a negar acesso e pedir confirmação.
Se o agente lê conversa de cliente, ticket, CRM, documento comercial ou histórico de atendimento, a barra sobe.
Não basta “meu assistente pessoal”. Você precisa de:
- base legal e permissão de acesso;
- regra de retenção;
- trilha de auditoria;
- supervisão humana;
- handoff;
- QA;
- limite de resposta;
- dono do erro.
Para arquivos próprios, organização local, leitura, diff e escrita confirmada em projeto pessoal, o caminho faça você mesmo é suficiente.
Quando entra cliente, produção, QA, handoff e dono do erro, o problema vira governança e evidência, não produtividade pessoal.
Links úteis dentro do site
- /agentes/ para os guias humanos.
- /skills/ para procedimentos copiáveis.
- /templates/ para checklists de decisão.
- Agente pessoal em VPS com Hermes para setup inicial.
Se você prefere ver em vídeo
sinal de demanda
Quer um vídeo para este guia: Regras de segurança para agente pessoal com acesso a arquivosSe bastante gente pedir, este assunto entra na fila de gravação. Não é promessa. Uma boa demonstração mostraria permissões, confirmação, segredo, diff e uma tarefa segura antes de liberar escrita. O pedido ajuda a priorizar demonstrações práticas.
Quando vale chamar ajuda.
Zild.ai agentes em produção + controle humanoEsse é o momento de pedir ajuda: quando o agente deixa de ser uso pessoal e começa a tocar cliente, atendimento, produção, QA, evidência, handoff ou rotina de time. A questão deixa de ser ferramenta e vira operação supervisionada.
materiais úteis
Entenda o limite aqui. Depois baixe o checklist ou a skill para usar no trabalho real.
acompanhar por fora do site
Continuo essas notas no LinkedIn.
Sigo publicando ali bastidores, leituras e decisões práticas sobre CRM, atendimento, WhatsApp, IA e agentes. Se esse texto ajudou, me acompanhe por lá também.