Agent OS
Systeme de SkillsCatalogue

self-improve

Boucle iterative 3-agents qui ameliore n'importe quel output. Brainstormer cree, Builder teste, Critic evalue et recherche.

Transforme n'importe quel brouillon en output de qualite professionnelle. 3 agents tournent en boucle jusqu'a ce que le score atteigne le seuil.

Declencheurs

  • "self-improve"
  • "ameliore ca en boucle"
  • "auto-amelioration"
  • "polish this"
  • "make this better in loops"
  • "iterate until perfect"

Comment ca marche

BRAINSTORMER → BUILDER → CRITIC → (boucle si score insuffisant)

  ┌─────────────┐     ┌─────────────┐     ┌─────────────┐
  │ BRAINSTORMER │────→│   BUILDER   │────→│   CRITIC    │
  │ Cree/ameliore│     │ Teste en    │     │ Evalue +    │
  │ avec feedback│     │ pratique    │     │ recherche   │
  └─────────────┘     └─────────────┘     └──────┬──────┘
        ↑                                        │
        │          score insuffisant ? boucle    │
        └────────────────────────────────────────┘

  Sortie quand : score atteint OU max iterations

Agent 1 — Brainstormer

Cree la premiere version (iteration 1) ou ameliore avec TOUT le feedback accumule (iterations 2+). Marque chaque changement avec la raison.

Agent 2 — Builder

Utilise l'output comme un vrai utilisateur. Note chaque blocage :

  • WHERE : ou dans l'output
  • WHAT : ce qui manque ou coince
  • WHY : impact pratique
  • SUGGEST : fix concret

Score de praticabilite /10.

Agent 3 — Critic

Evalue + recherche les meilleures pratiques sur le web :

  • Compliance check (si des regles sont fournies)
  • Score 5 dimensions : completude, clarte, correction, praticite (x2), elegance
  • Recherche web pour les standards manques
  • Verdict : PASS ou FAIL

Configuration

OptionDefautDescription
max_iterations4Nombre max de boucles
threshold8/10Score minimum pour PASS
rulesaucuneRegles de conformite a injecter
web_researchtrueLe Critic recherche en ligne

Tu configures inline : "self-improve this doc, threshold 9, max 6 iterations, rules=writing-guide.mdx"

Exemple d'utilisation

Toi : "self-improve cette procedure de deploiement"

Iteration 1 :
  Brainstormer → premiere version ambitieuse
  Builder → "l'etape 3 manque la commande de rollback" (7/10)
  Critic → "pas de section troubleshooting, Google recommande..." (6.5/10)

Iteration 2 :
  Brainstormer → integre rollback + troubleshooting
  Builder → "tout fonctionne sauf l'etape 5 ambigue" (8.5/10)
  Critic → "conforme, 1 lien manquant" (8.2/10) → PASS

Quand l'utiliser

SituationUtiliser self-improve ?
Premier brouillon de n'importe quoiOui
Output "ok mais pas genial"Oui
Contenu avec des regles a respecterOui (injecter les regles)
Tache triviale (renommer un fichier)Non
Brainstorm en cours (pas fini)Non

Patterns combines

Le skill fusionne 6 patterns eprouves :

  1. Iterative Refinement — boucle d'amelioration
  2. Reflexion — l'agent reflechit a ses erreurs
  3. Multi-Agent Debate — plusieurs perspectives
  4. Constitutional AI — regles inviolables injectees
  5. Evaluator-Optimizer — score + amelioration ciblee
  6. Karpathy Loop — train, eval, improve, repeat

Fichier source

~/.claude/skills/self-improve/SKILL.md (299 lignes)

Lecture liee

On this page