$ man how-to/testing-ai-features-recursive-method
כלי CLIintermediate
בדיקת פיצ'רים חדשים של AI עם Recursive Drift
לולאת בנה-בדוק-חקור-קודד כדי להישאר מעודכן בלי להיות מוצף
הבעיה: מהירות הפיצ'רים
כלי AI מוציאים עדכונים מהר יותר ממה שאפשר ללמוד. Claude Code, Cursor, ChatGPT, Windsurf - כולם דוחפים פיצ'רים חדשים מדי שבוע. לפעמים מדי יום. וכל פיצ'ר עלול לשנות את אופן העבודה שלך.
התגובה הטבעית היא אחת משתי קיצוניות. להתעלם מהכל ולהמשיך לעשות מה שעובד עד שזה נשבר. או לרדוף אחרי כל עדכון ולעולם לא לסיים שום דבר כי אתה תמיד לומד משהו חדש.
שתיהן מפסידות. האדם הראשון מפספס את הפיצ'ר שהיה חוסך לו 3 שעות ביום. האדם השני אף פעם לא מוציא לפועל כי הוא תמיד באמצע למידה.
אתה צריך נתיב ביניים. דרך שיטתית לסנן, לבדוק ולשלב פיצ'רים חדשים בלי להוריד מפסים את העבודה האמיתית שלך.
PATTERN
לולאת ארבעת השלבים
בנה. בדוק. חקור. קודד.
ארבעת השלבים האלה הם Recursive Drift מיושם להערכת פיצ'רים. כל שלב מייצר פלט שמזין את הבא, והשלב האחרון מזין חזרה למערכת שלך כדי שההערכה הבאה מתחילה חכמה יותר.
בנה: ממש תשתמש בפיצ'ר. אל תקרא את הchangelog ותגבש דעה. פתח טרמינל ותנסה. בנה משהו אמיתי עם זה, לא דוגמת צעצוע. אתה לא יודע אם פיצ'ר עובד עד שהוצאת משהו איתו.
בדוק: הערך את מה שבנית. האם זה עבד? האם זה היה מהיר יותר? האם זה הכניס בעיות? זה לא "האם זה רץ בלי שגיאות." זה "האם זה עושה את תהליך העבודה הקיים שלי טוב יותר או גרוע יותר." השתמש בהקשר שני להערכה - טרמינל אחר, סשן אחר, נקודת מבט רעננה.
חקור: שאל את הAI על מה שקרה. מה הפיצ'ר ממש עשה מתחת למכסה? מהם מקרי הקצה? מה הוא בחר לא לעשות? העתק את פלט הבנייה שלך לסשן חדש ובקש ממנו לבקר את עצמו. ההערכה העצמית של הAI חושפת מגבלות ששלב הבנייה פיספס.
קודד: הפוך ידע מאומת לתשתית ניתנת לשימוש חוזר. כתוב skill. עדכן תהליך עבודה. הוסף לקבצי הזיכרון שלך. אם הפיצ'ר שווה שימוש, הוא שווה תיעוד בצורה שהסשנים העתידיים שלך יכולים לגשת אליה אוטומטית.
FORMULA
שיטת שני הטרמינלים
טרמינל 1 הוא הבנאי. טרמינל 2 הוא המעריך. הם אף פעם לא מתמזגים.
ההפרדה היא השיטה. כשאתה בונה ומעריך באותו סשן, הטיית אישור משתלטת. הAI שבנה את הדבר יגן על הדבר שהוא בנה. הקשר רענן אין לו התקשרות לפלט.
תהליך עבודה:
1. טרמינל 1: התחל לבנות עם הפיצ'ר החדש. תן לו משימה אמיתית מהעבודה שלך.
2. תן לו לרוץ. אל תפריע.
3. טרמינל 2: פתח סשן חדש. הדבק את הפלט מטרמינל 1. שאל: "מה זה עושה טוב? מהן המגבלות? מה ישבור את זה?"
4. קח את הממצאים של טרמינל 2 והדבק אותם חזרה בטרמינל 1. בקש ממנו להתייחס לדאגות.
5. חזור עד שיש לך תמונה ברורה של מה עובד ומה לא.
זו לולאת freefall-break-ask מRescursive Drift, שהוצאה החוצה לשני הקשרים. הבנאי נופל חופשי. המעריך שובר. ההלוך-חזור הוא מצב השאל. ההפרדה מכריחה כנות.
PRO TIP
חקירה כדיבוג
שלב החקירה הוא המקום שבו רוב האנשים עוצרים מוקדם מדי. הם בודקים את הפיצ'ר, מחליטים "זה עובד" או "זה לא עובד," וממשיכים הלאה. זה בינארי כשאתה צריך ספקטרום.
שאל את הAI על מה שהוא בנה. לא "האם זה עבד?" אלא "אילו הנחות עשית? מה היה קורה אם הקלט היה פי 10 גדול יותר? מה בחרת לא לעשות?"
העתק פלטים מסשן אחד לאחר. לטרמינל 2 אין את ההקשר של טרמינל 1, וזו הנקודה. הוא קורא את הפלט קר. הוא תופס דברים שחלון ההקשר של הבנאי קבר.
התבנית: בנה בהקשר א', הערך בהקשר ב', סנתז בהקשר א'. ההאבקה הצולבת הזו מעלה מקרי קצה, מגבלות ביצועים ומצבי כשלון שהיית מפספס בתהליך עבודה של הקשר יחיד.
דוגמה אמיתית: בדיקת צוותי סוכנים בClaude Code. טרמינל 1 בנה צוות, הריץ משימות, הפעיל את מערכת ההודעות. טרמינל 2 קיבל את הפלט המלא וזיהה שהמשימה הייתה למעשה פשוטה מדי לצוותים - תת-סוכנים היו יותר זולים ומהירים. ההערכה הזו הפכה לskill ניתוב הסוכנים. הבדיקה של הפיצ'ר ייצרה את הגדר נגד השימוש לרעה שלו.
PATTERN
מהערכה לskill
שלב החקירה מייצר ידע גולמי. שלב הקידוד הופך אותו לתשתית.
כשאתה מאמת שפיצ'ר עובד, יש לך שלוש אפשרויות. אתה יכול לזכור את זה ולשכוח עד השבוע הבא. אתה יכול לסמן את הדוקומנטציה ולא לקרוא אותה שוב. או שאתה יכול לכתוב את זה במערכת שלך - קובץ skill, כלל בCLAUDE.md, מסמך תהליך עבודה, ערך how-to.
האפשרות השלישית היא היחידה שמצטברת. כל פיצ'ר שאתה מקודד הופך את המערכת שלך לצפופה יותר. הסשן הבא מתחיל עם הידע הזה כבר טעון. אתה לא לומד מחדש. אתה בונה על גבי מה שהסשן הקודם גילה.
תבנית הקידוד:
- מה הפיצ'ר עושה (משפט אחד)
- מתי להשתמש בו לעומת מתי לא (פלט הסינון)
- תהליך העבודה שעבד (ממצאי שני הטרמינלים)
- מגבלות ידועות (מהחקירה)
- skills קשורים שהוא מתחבר אליהם
התבנית הזו עצמה היא תוצר של הלולאה הרקורסיבית. היא שוכללה לאורך הערכות פיצ'רים מרובות עד שהתבנית התייצבה.
ANTI-PATTERN
סינון: מה ראוי ללולאה המלאה
לא כל עדכון ראוי ללולאה המלאה. המטרה היא עומק סלקטיבי, לא כיסוי מקיף.
הרץ את הלולאה המלאה כש:
- פיצ'ר ממפה לנקודת כאב ידועה בתהליך העבודה שלך. עבדת סביב משהו ידנית. העדכון עשוי לאוטמט את זה.
- פיצ'ר משנה התנהגות שאתה תלוי בה. שינויים שוברים צריכים תשומת לב מיידית. הskills ותהליכי העבודה הקיימים שלך עלולים להפסיק לעבוד.
- פיצ'ר מאפשר משהו שלא היה אפשרי קודם. יכולות חדשות מרחיבות את מה שאתה יכול לבנות. אלה ההערכות עם החזר ההשקעה הגבוה ביותר.
דלג כש:
- הפיצ'ר עבור מקרה שימוש שאין לך. לא כל עדכון רלוונטי.
- השינוי קוסמטי או מינורי. שינויי ממשק לעתים רחוקות משפיעים על הפלט.
- אתה באמצע ספרינט בדדליין. תזמן את ההערכה, אל תתן לה להפריע לעבודת ייצור.
הסינון לוקח 5 דקות. סרוק את הchangelog. התאם מול נקודות הכאב הפעילות שלך. אם שום דבר לא מתאים, המשך הלאה. אם משהו מתאים, הרץ את הלולאה. עם הזמן אתה מפתח אינטואיציה לאילו עדכונים חשובים. האינטואיציה הזו היא עצמה skill מצטבר שנבנה מהרצת הלולאה מספיק פעמים.
מדריכים קשורים