Couts
Couts par composant, estimation mensuelle, comment surveiller et optimiser les depenses d'Agent OS.
Couts
Agent OS a un cout operationnel. Il faut le connaitre, le surveiller, et l'optimiser.
Couts par composant
API Anthropic (LLM)
C'est le poste principal. Tous les agents utilisent Claude.
| Usage | Tokens/jour estimes | Cout/jour | Cout/mois |
|---|---|---|---|
| CEO (briefs, coordination) | ~50K input + 10K output | ~$0.50 | ~$15 |
| Social Manager | ~30K input + 5K output | ~$0.25 | ~$7.50 |
| Trader (analyse) | ~40K input + 8K output | ~$0.35 | ~$10.50 |
| OPS Manager | ~20K input + 3K output | ~$0.15 | ~$4.50 |
| Autres agents (10) | ~100K input + 20K output | ~$0.80 | ~$24 |
| Total LLM | ~$2.05/jour | ~$61.50 |
!!! note "Ces chiffres sont des estimations" Le cout reel depend de l'activite. Jours calmes = moins cher. Gros projet = plus cher.
Infra (serveur)
| Composant | Specification | Cout/mois |
|---|---|---|
| VPS principal | 4 cores, 16GB RAM | ~$20-40 |
| Stockage additionnel | 100GB SSD | ~$5 |
| Domaines | 2-3 domaines | ~$2 |
| Total infra | ~$27-47 |
Services tiers
| Service | Usage | Cout/mois |
|---|---|---|
| Notion | Workspace | Gratuit (plan gratuit) |
| Telegram | Bot | Gratuit |
| Cloudflare | DNS, Pages, R2 | Gratuit (plan gratuit) |
| GitHub | Repos prives | Gratuit |
| Total services | $0 |
MCPs et APIs externes
| MCP / API | Usage | Cout/mois |
|---|---|---|
| Hyperliquid | Trading | Frais de trading (variable) |
| Twitter API | Posting | Gratuit (via stealth browser) |
| Posting | Gratuit (via stealth browser) | |
| Stalwart (self-hosted) | $0 | |
| Total MCPs | Variable |
Estimation mensuelle totale
| Poste | Fourchette basse | Fourchette haute |
|---|---|---|
| API Anthropic | $40 | $80 |
| Infra | $27 | $47 |
| Services tiers | $0 | $0 |
| MCPs / APIs | $0 | $20 |
| Total | $67 | $147 |
Surveiller les couts
Dashboard Anthropic
Consulter console.anthropic.com pour le suivi en temps reel.
Metriques internes
Le CEO suit les tokens par agent par jour.
Rapport tokens (hier) :
- CEO : 48,230 input / 9,876 output = $0.47
- Social Manager : 28,100 input / 4,500 output = $0.22
- Trader : 35,600 input / 7,200 output = $0.31
Total : $1.00 (sous budget de $2.05)Alertes cout
| Seuil | Action |
|---|---|
| Jour > $5 | WARNING dans le brief |
| Jour > $10 | ERROR + notification immediate |
| Mois > $150 | Audit des agents les plus consommateurs |
Optimiser les couts
1. Prompt caching
Utiliser le prompt caching d'Anthropic pour les instructions systeme repetees. Economie : 50-70% sur les tokens input des instructions agent.
2. Reduire la frequence des crons
Un health check toutes les heures peut devenir toutes les 2h si l'infra est stable.
| Changement | Economie estimee |
|---|---|
| CRON-001 de 1h a 2h | -50% tokens OPS |
| CRON-007 de 4h a 8h | -50% tokens Trader |
| CRON-004 de 3x/jour a 2x/jour | -33% tokens Social |
3. Modeles adaptes
Pas besoin de Claude Opus pour un health check. Utiliser le modele le moins cher qui fait le travail.
| Tache | Modele recommande | Raison |
|---|---|---|
| Health check | Haiku | Tache simple, rapide |
| Brief CEO | Sonnet | Synthese de qualite |
| Analyse trading | Opus | Raisonnement complexe |
| Posts sociaux | Sonnet | Creativite + rapidite |
4. Batching
Regrouper les appels API quand possible. Un seul appel pour 5 posts vaut mieux que 5 appels individuels.
!!! tip "Le cout le plus dangereux = le cout invisible" Un agent qui boucle silencieusement peut bruler $50 en une nuit. Toujours avoir un timeout et une alerte de depassement.
Lecture liee
- KPIs pour les metriques de performance/cout
- Vue d'ensemble des crons pour les frequences
- Gestion des erreurs quand un depassement est detecte