$ man how-to/model-selection-strategy
Eficiencia de Costosbeginner
Estrategia de Seleccion de Modelos
Empareja el modelo con la tarea - deja de sobrepagar por trabajo simple
El Principio Central
No toda tarea necesita el modelo mas capaz. Usar un modelo capaz (tier Opus) en una tarea simple de reformateo es como contratar un arquitecto senior para pintar una pared. Usar un modelo rapido (tier Sonnet) en una decision de arquitectura compleja es como contratar un pasante junior para disenar el edificio. El principio central: empareja el modelo con la tarea. Las tareas simples obtienen modelos rapidos. Las tareas complejas obtienen modelos capaces. Todo lo que esta entre medio es una decision de juicio, y el marco a continuacion te ayuda a tomarla.
PATTERN
El Marco de Emparejamiento
Los modelos rapidos funcionan para: reformatear contenido, escanear archivos, ediciones de codigo simples, tareas de copiar-pegar-y-adaptar, transformaciones de datos directas, construir paginas que reflejen patrones existentes. Estas tareas tienen entradas claras, salidas claras y baja ambiguedad.
Los modelos capaces funcionan para: decisiones de arquitectura, depuracion compleja, escritura creativa con voz matizada, cadenas de razonamiento multi-paso, sintesis de investigacion y cualquier cosa donde el agente necesite hacer juicios. Estas tareas tienen ambiguedad, compensaciones y requieren que el modelo piense profundamente.
La linea divisoria: esta tarea requiere juicio o es mecanica? Las tareas de juicio obtienen el modelo capaz. Las tareas mecanicas obtienen el modelo rapido. Si no estas seguro, empieza con el modelo rapido. Si la salida es mala, escala. Es mas barato probar rapido y actualizar que usar el costoso como predeterminado para todo.
PRO TIP
Seleccion de Modelo para Agentes Paralelos
Al ejecutar agentes paralelos, asigna modelos por tarea. El agente orquestador usa el modelo capaz porque necesita razonar sobre dependencias, contexto y secuenciacion. Los sub-agentes que hacen trabajo directo (reflejar una pagina existente, actualizar una configuracion, ejecutar una verificacion de build) usan modelos rapidos. Los sub-agentes que hacen trabajo creativo pesado (escribir 17 entradas de wiki, arquitectar una nueva funcionalidad) usan el modelo capaz.
Esto no se trata de ser tacano. Se trata de ser eficiente. Un modelo rapido que completa en 30 segundos una tarea simple es mejor que un modelo capaz que toma 2 minutos en la misma tarea con calidad identica. La velocidad se acumula en agentes paralelos. Cinco agentes rapidos en tareas simples terminan antes que un agente capaz en las mismas cinco tareas.
FORMULA
El Metodo de Seguimiento Diario
Rastrea tu uso de modelos durante una semana. Al final de cada dia, anota que tareas usaron que modelo y si la calidad del resultado fue suficiente. Busca dos patrones:
1. Sesiones de modelo capaz donde un modelo rapido habria producido la misma calidad. Estos son sobregastos. Cambia esos tipos de tareas a modelos rapidos.
2. Sesiones de modelo rapido donde la salida fue mala y tuviste que rehacer el trabajo. Estos son falsa economia. Cambia esos tipos de tareas a modelos capaces.
Despues de una semana, tendras un mapa claro de que tareas necesitan que modelo. Aplica ese mapa en adelante. Revisitalo trimestralmente a medida que los modelos mejoran (el modelo capaz de hoy se convierte en el modelo rapido de manana).
knowledge guide
guías relacionadas