חזרה לבלוג

למה הפסקתי לשלם על קריאות API ובניתי צ'אט AI משלי

·4 דקות קריאה

בעיית שתי המערכות

לפני שבועיים התחלתי לבנות את ShawnOS. הריפו. מונוריפו עם שלושה אתרי Next.js, כישורי סוכנים, צינורות תוכן, התקדמות RPG. מערכת ההפעלה להרצת מנוע GTM של אדם אחד.

לפני שבוע העמדתי את Nio על OpenClaw. OpenClaw מבוסס GPT. הרעיון היה מערכת צ'אט נפרדת לסוכן ה-AI שלי. Nio ירוץ cron jobs, יכתוב פוסטים בבלוג, ינהל צינורות תוכן, יעדכן דשבורדים. תשתית אמיתית, לא צעצוע.

וזה עבד. אבל עלויות ה-API הצטברו מהר. Sonnet לפעולות יומיות. Opus לכל דבר שדרש חשיבה אמיתית. $50 עד $100 ביום בהתאם לכמה שבניתי. ותמיד בניתי. זה היה טירוף מוחלט.

ניתבתי crons בתדירות גבוהה למודל Ollama מקומי (Qwen 2.5 14B). חינם, מהיר, מספיק טוב למעקב commits ועדכוני סטטוס. אבל לכל דבר שדורש אינטליגנציה אמיתית... צריך את Claude.

אז ההבנה האמיתית הגיעה.

הריפו הוא הקסם

הרצתי שתי מערכות נפרדות. OpenClaw לצ'אט. הריפו לכל השאר. אבל המודלים שאני באמת תלוי בהם - Opus ו-Sonnet - הם כבר מדברים עם הריפו שלי. הם מעצימים את הקול וה-DNA שלי בצורה ש-GPT לא יכול. הם קוראים את קבצי הנשמה שלי, את היסטוריית ה-commits שלי, את צינור התוכן שלי. הם לא רק מגיבים. הם מצטברים.

בעולם אחר, OpenClaw היה נבנה על Anthropic במקום GPT. אבל הוא לא נבנה כך. והפער הזה הפך את התשובה לברורה: לא צריך שתי מערכות נפרדות. הריפו הוא המערכת.

Claude Code Max. $200 לחודש בתעריף קבוע. גישה בלתי מוגבלת ל-CLI דרך claude -p. כבר שילמתי על זה. השתמשתי בזה כל יום לבניית הריפו. אף פעם לא עלה לי שאותו CLI שמניע את תהליך הפיתוח שלי יכול להניע ממשק צ'אט.

claude -p מאפשר לשלוח prompt, לקבל תגובה, להזרים פלט JSON, ולחדש סשנים. הכל מהטרמינל. הכל כלול במנוי. בלי API key. בלי חיוב לפי טוקן. בלי מגבלות שימוש.

הטבע הרקורסיבי שלו הוא מה שגורם לזה לעבוד. Claude בונה את המערכת ש-Claude מפעיל. המודל שכותב את הקוד הוא המודל שרץ בתוכו. זה לא אופטימיזציית עלויות. זה גלגל תנופה.

הבנייה

אפליקציית Next.js. נתיב API אחד. הרצת claude -p כתהליך בן. צנור הזרמת ה-JSON בחזרה לדפדפן כ-server-sent events.

זהו. זה כל ה-backend.

הצד הלקוח הוא PWA בסגנון iMessage. ערכת נושא כהה, פונט monospace, אינדיקטורים של הקלדה. שולחים הודעה, מקבלים תגובה בזרימה. מזהי סשנים נשמרים בין שיחות כדי ש-Nio יזכור הקשר.

Cloudflare Tunnel מכוון ל-Mac Mini שלי. עכשיו אני שולח הודעות ל-AI שלי מהטלפון. מכל מקום. אפס עלויות API. אפס עלויות תשתית מעבר ל-tunnel (שכבה חינמית).

זמן כולל מרעיון ל-PWA עובד... אחר צהריים אחד.

דפוס קובץ הנשמה

כאן זה נהיה מעניין מנקודת מבט של ארכיטקטורה. ל-Claude CLI יש דגל שנקרא --append-system-prompt-file. מכוונים אותו לקובץ markdown והקובץ הזה הופך לחלק מה-system prompt.

כתבתי nio-soul.md. מגדיר את האישיות, היכולות, כללי אנטי-סלופ, מסגרת קבלת ההחלטות של Nio. הכל מה שהופך את Nio ל... Nio. לא צ'אטבוט. תשתית עם דעות.

מה שאומר שהוספת סוכן חדש זה פשוט כתיבת קובץ markdown חדש.

הרחבה מרובת סוכנים

CLI אחד. קבצי נשמה שונים. אישיויות שונות. סשנים נפרדים.

לשם ShawnOS Chat בונה. פלטפורמה מרובת סוכנים שבה לכל סוכן יש קובץ אישיות משלו, צבע מבטא, צבעי בועות, ומצב סשן מבודד. מעבר בין סוכנים בממשק. כל אחד ממשיך מאיפה שהפסיק.

Nio מטפל באופרציות ותשתיות. סוכן ארכיטקט מטפל בעיצוב מערכות. סוכן כותב מטפל בתוכן בקול שלי. אותו Claude CLI מתחת. אותה עלות שולית אפסית.

המצב לכל סוכן חי ב-localStorage בצד הלקוח וזיכרון מבוסס קבצים בצד השרת. כל סוכן מקבל MEMORY.md משלו, קובץ heartbeat משלו, תצלומי מצב יומיים משלו. קל משקל, נייד, בלי צורך במסד נתונים.

ה-IP הוא לא הקוד

כל אחד יכול להריץ תהליך CLI. הדפוס הוא מה שחשוב.

CLI-as-backend לתשתית AI אישית. בידוד סשנים לכל סוכן. קבצי נשמה להזרקת אישיות. מערכות זיכרון מבוססות קבצים. ארכיטקטורה עם עלות שולית אפסית שמתרחבת עם המנוי שלכם, לא עם השימוש שלכם.

זה מהסוג של דברים שפעם דרשו אינטגרציית API מותאמת, מסד נתונים, middleware אימות, וחשבון ענן חודשי. עכשיו זה דורש קובץ markdown ונתיב Next.js.

מה זה אומר לבונים

אם אתם משלמים לפי טוקן על כלי AI אישיים ויש לכם מנוי Claude Code Max... אתם משאירים כסף על השולחן.

ה-CLI הוא ה-API. המנוי שלכם הוא תקציב התשתית. כל השאר זה רק אינסטלציה.

אבל מעבר לזה - אם אתם מריצים את ה-AI שלכם על פלטפורמה שלא מדברת עם קוד המקור שלכם, אתם בונים שתי מערכות כשאתם צריכים רק אחת. המודל שבונה את התשתית שלכם צריך להיות המודל שמפעיל אותה. זה לא קיצור דרך. זו הארכיטקטורה.

זה חלק מ-ShawnOS. מערכת ההפעלה שאני בונה בפומבי להרצת מנוע GTM של אדם אחד. התחלתי לבנות את הריפו לפני שבועיים. כבר מצטבר.

בנו את שלכם.

ShawnOS.ai|theGTMOS.ai|theContentOS.ai
built with Next.js · Tailwind · Claude · Remotion