$ man how-to/model-selection-strategy

יעילות עלויותbeginner

אסטרטגיית בחירת מודלים

התאם את המודל למשימה - תפסיק לשלם יותר מדי על עבודה פשוטה


העיקרון המרכזי

לא כל משימה צריכה את המודל הכי מסוגל. שימוש במודל מסוגל (רמת Opus) למשימת פרמוט פשוטה זה כמו לשכור אדריכל בכיר כדי לצבוע קיר. שימוש במודל מהיר (רמת Sonnet) להחלטה ארכיטקטונית מורכבת זה כמו לשכור מתמחה צעיר כדי לתכנן את הבניין. העיקרון המרכזי: התאם את המודל למשימה. משימות פשוטות מקבלות מודלים מהירים. משימות מורכבות מקבלות מודלים מסוגלים. כל מה שבאמצע הוא שיקול דעת, והמסגרת להלן עוזרת לך לקבל את ההחלטה.
PATTERN

מסגרת ההתאמה

מודלים מהירים מתאימים ל: פרמוט תוכן, סריקת קבצים, עריכות קוד פשוטות, משימות העתק-הדבק-והתאם, טרנספורמציות נתונים ישירות, בניית דפים שמשקפים תבניות קיימות. למשימות האלה יש קלטים ברורים, פלטים ברורים ועמימות נמוכה. מודלים מסוגלים מתאימים ל: החלטות ארכיטקטורה, דיבוג מורכב, כתיבה יצירתית עם קול מנואנס, שרשראות חשיבה רב-שלביות, סינתזת מחקר, וכל דבר שבו הסוכן צריך להפעיל שיקול דעת. למשימות האלה יש עמימות, פשרות, והן דורשות מהמודל לחשוב לעומק. קו ההפרדה: האם המשימה הזו דורשת שיקול דעת או שהיא מכנית? משימות שיקול דעת מקבלות את המודל המסוגל. משימות מכניות מקבלות את המודל המהיר. אם אתה לא בטוח, התחל עם המודל המהיר. אם הפלט גרוע, העלה. זה יותר זול לנסות מהיר ולשדרג מאשר להשתמש כברירת מחדל ביקר על הכל.
PRO TIP

בחירת מודל לסוכנים מקבילים

כשמריצים סוכנים מקבילים, הקצה מודלים לפי משימה. הסוכן המתזמר משתמש במודל המסוגל כי הוא צריך לנמק לגבי תלויות, הקשר ורצף. תת-סוכנים שעושים עבודה ישירה (שכפל דף קיים, עדכן קובץ הגדרות, הרץ בדיקת build) משתמשים במודלים מהירים. תת-סוכנים שעושים עבודה יצירתית כבדה (כתיבת 17 ערכי ויקי, תכנון ארכיטקטורה של רכיב חדש) משתמשים במודל המסוגל. זה לא עניין של לחסוך. זה עניין של יעילות. מודל מהיר שמסיים ב30 שניות על משימה פשוטה עדיף על מודל מסוגל שלוקח 2 דקות על אותה משימה באותה איכות. מהירות מצטברת לאורך סוכנים מקבילים. חמישה סוכנים מהירים על משימות פשוטות מסיימים לפני סוכן מסוגל אחד על אותן חמש משימות.
FORMULA

שיטת המעקב היומי

עקוב אחרי השימוש במודלים שלך למשך שבוע. בסוף כל יום, רשום אילו משימות השתמשו באיזה מודל והאם איכות הפלט הייתה מספקת. חפש שתי תבניות: 1. סשנים של מודל מסוגל שבהם מודל מהיר היה מייצר את אותה איכות. אלה הוצאה מיותרת. העבר את סוגי המשימות האלה למודלים מהירים. 2. סשנים של מודל מהיר שבהם הפלט היה גרוע והיית צריך לעשות את העבודה מחדש. אלה חיסכון מדומה. העבר את סוגי המשימות האלה למודלים מסוגלים. אחרי שבוע, תהיה לך מפה ברורה של אילו משימות צריכות איזה מודל. יישם את המפה הזו מעכשיו. בדוק מחדש כל רבעון ככל שמודלים משתפרים (המודל המסוגל של היום הופך למודל המהיר של מחר).

מדריכים קשורים
ניהול קרדיטים וטוקניםתבניות סוכנים מקביליםתזמור תהליכי עבודה רב-סוכנייםהאם כדאי לך לרכוש Clay? הערכה עצמאית של מהנדס Go-to-Market
ויקי מדריכיםמדריך ידע
ShawnOS.ai|theGTMOS.ai|theContentOS.ai
built with Next.js · Tailwind · Claude · Remotion