פקודות ChatOps
להלן מבנה אחיד לכל פקודה: מתי להשתמש, פרמטרים, הרשאות, מה לחפש בפלט, ודוגמה קצרה אם יש ערך מוסף.
כרטיסיות חיפוש (Ctrl/Cmd+K)
ניתן לפתוח את החיפוש הגלובלי (
Ctrl/Cmd+K) ולמצוא כל פקודת ChatOps במהירות. הכרטיסים מוזנים מקובץwebapp/static/data/commands.jsonולכן חובה לעדכן אותו בכל פעם שמוסיפים פקודה חדשה.הכרטיסים מפנים חזרה לעמוד זה – לחיצה על
/cache_clear_stale,/status_workerאו/version_historyתגלול ישירות לסקשן המתאים כאן.מידע נוסף על מבנה הקטלוג נמצא ב-:doc:
/webapp/commands-catalog.
/status
מתי להשתמש: כשצריך תמונת מצב מהירה על תעבורה/לטנסי + Health בסיסי.
פרמטרים:
--since <duration>– חלון אחורה מעכשיו. תומךm/h/d(לדוגמה:15m,2h,1d)--from <iso8601> --to <iso8601>– חלון זמן ספציפי (לחקירת עבר)(אופציונלי ב-/errors בלבד:
--endpoint,--min_severity)
ברירת מחדל: 5 דקות אחרונות.
Timezone: אם לא צוין אזור זמן ב-ISO8601, מניחים UTC (ומציינים זאת בפלט).
Safety: חלון מקסימלי 24 שעות (כדי למנוע שאילתות כבדות).
הרשאות: מנהלים בלבד (ובצ’אטים מורשים).
מה לחפש בפלט:
Total Requests בחלון
Latency percentiles: p50/p95/p99
Slowest Endpoints בחלון
Active Requests (רגעי) + Health בסיסי (DB/Redis/Sentry/OTEL)
דוגמאות:
/status --since 15m
/status --from 2025-12-16T10:00 --to 2025-12-16T10:15
/health
מתי להשתמש: אותו צורך כמו /status, לטובת משתמשים שמכירים את השם הישן.
פרמטרים: כמו /status
הרשאות: כולם (בצ’אט מורשה)
מה לחפש בפלט: זהה ל-/status; הפקודה היא אליאס מלא ולכן צריכה להחזיר אותו פלט בדיוק.
/uptime
מתי להשתמש: לבדוק אחוז זמינות היסטורי ומשך פעילות מאז העלייה האחרונה.
פרמטרים: אופציונלי
window=<minutes|hours>(ברירת מחדל: 24h)הרשאות: מנהלים בלבד
מה לחפש בפלט: uptime%, משך מאז restart, החרגות (planned maintenance) אם קיימות.
/system_info
מתי להשתמש: לבדוק עומסי CPU/זיכרון/דיסק בחתך רגעי.
פרמטרים: ללא
הרשאות: מנהלים בלבד
מה לחפש בפלט: אחוזי CPU, שימוש RAM, swap, גרסת מערכת, env רלוונטי (לדוגמה
ASSET_VERSION).
/check commands
מתי להשתמש: כשצריך לוודא אילו פקודות Slash באמת רשומות בקוד בזמן ריצה (כולל פקודות שלא מופיעות בתפריט של טלגרם), ולראות מה “מוסתר” מהתפריט.
פרמטרים:
commands(חובה). בלי פרמטרים (/check) הפקודה מציגה רק את פקודות התפריט של טלגרם (Public/Personal).הרשאות: מנהלים בלבד (
ADMIN_USER_IDS)מה לחפש בפלט:
All Registered Commands (runtime)– הרשימה האמיתית שלCommandHandlerשנרשמו ב־ApplicationHidden Commands– פקודות שבקוד אבל לא בתפריט טלגרםMenu-only– פקודות שבתפריט אבל לא קיימות בקוד (עוזר לזהות דריפט/שאריות קונפיג)
הערה: הפקודה לא מנסה להסיק פקודות שמופעלות דרך
MessageHandler/כפתורים/טקסט חופשי — רק מה שנרשם כ־Slash.דוגמה:
/check commands
/metrics
מתי להשתמש: לשלוף dump מלא של מדדי Prometheus לצורך ניתוח חיצוני.
פרמטרים: ללא
הרשאות: מנהלים בלבד
מה לחפש בפלט: קובץ
.txtשמכיל את כל המטריקות; ודא שהבוט מציין אם נחתך או נשלח בקובץ.
/observe
מתי להשתמש: לסקירה מהירה של בריאות השירות בלי רעש.
פרמטרים: אופציונליים
source=db|memory|all,window=5m|1h|24hהרשאות: מנהלים בלבד
מה לחפש בפלט: סטטוס latency/error-rate/uptime + ציון מקור הנתונים, ספירת alerts קצרה, cooling מצב נוכחי.
/observe -v (מפורט)
מתי להשתמש: כשצריך פירוט רחב יותר (alerts מפורקים, שגיאות אחרונות, sinks).
פרמטרים: כמו /observe
הרשאות: מנהלים בלבד
מה לחפש בפלט:
Latency/Error Rate עם ספים אדפטיביים
Alerts DB מול Memory (כולל critical count)
Recent Errors (N≤5)
Cooling/Sinks סטטוס
דוגמה:
/observe -v window=5m source=all
/observe -vv (מפורט מאוד)
מתי להשתמש: כשצריך גם מזהי התראות אחרונים מה-DB להמשך תחקור/ביטול.
פרמטרים: כמו /observe
הרשאות: מנהלים בלבד
מה לחפש בפלט: כל מה שפורט ב-/observe -v ועוד SECTION של
Recent Alert IDs (DB, N≤10).
/errors
מתי להשתמש: לקבל את 10 השגיאות האחרונות שחזרו מהמערכת.
פרמטרים:
--since <duration>או--from <iso8601> --to <iso8601>--endpoint /path(אופציונלי)--min_severity ERROR(אופציונלי; תומך גם WARNING/CRITICAL וכו«)עדיין נתמך גם פורמט ישן
service=.../endpoint=...לטובת תאימות
ברירת מחדל: כמו היום – Top ב-5/30/120 דקות + Sentry issues אם מוגדר.
הרשאות: מנהלים בלבד (נבדק גם throttling)
מה לחפש בפלט:
Top Error Signatures + Counts
דגימות של
request_id/trace_id(אם קיימים)קישור Sentry לפי חתימה (כשאפשר) + פקודת המשך:
/errors examples <signature>
סטטוסי תוצאות (Mappings)
אנו ממפים תוצאות לסטטוסים אחידים לצורך ניתוח מהיר ודשבורדים:
2xx– הצלחהcancelled– פעולה שבוטלה ע“י משתמש/זרימהerror/5xx– כשל כללי
לייבלים משלימים במטריקות:
status,cache_hit.
/alerts
מתי להשתמש: לראות את 5 ההתראות האחרונות שנוצרו (DB + קורלציה).
פרמטרים: אופציונלי
severity=<critical|high|low>הרשאות: מנהלים בלבד
מה לחפש בפלט: שם כלל ההתראה, severity, זמן פתיחה, האם קיימת השתקה פעילה.
/jobs
מתי להשתמש: כשצריך נראות מרוכזת לריצות רקע וגם לפעולות משתמש שרצות ברקע (Drive/Reminders/Batch) – כולל לוגים וסטטוסים.
פרמטרים:
ללא פרמטרים: סיכום כללי לפי קטגוריות
active– רשימת הרצות פעילות עכשיוfailed– כשלים אחרונים + קישור ללוגים ב-WebApp<job_id>– פרטי Job ספציפי + היסטוריית הרצות קצרה<category>– למשלbackup,sync,batch,cache,cleanup,monitoring,other
הרשאות: לפי מדיניות ה-ChatOps/אדמין (בדומה לשאר הפקודות המנהליות).
מה לחפש בפלט:
סטטוס
running/failed/skipped/completedrun_idוקישור ישיר ל-/jobs/monitor?run_id=...אם קישורים לא נראים תקין – ודאו ש-
WEBAPP_URLמוגדר בסביבה.
דוגמאות:
/jobs
/jobs active
/jobs failed
/jobs drive_123456
/jobs batch
/incidents
מתי להשתמש: מעבר מהיר על יומן התקלות האחרון (Incident Memory).
פרמטרים: אופציונלי
limit=<n>(ברירת מחדל 5)הרשאות: מנהלים בלבד
מה לחפש בפלט: תאריך/שעה, תקציר, בעלים, סטטוס (ongoing/resolved).
/triage
מתי להשתמש: תחקור מהיר של תקלה פעילה לפי
request_id.פרמטרים:
request_id=<id>אופציונלי (אם אין – מוצגות חריגות חמות ביותר)הרשאות: מנהלים בלבד (עם הגבלת קצב)
מה לחפש בפלט: Root cause משוער, גרפים רלוונטיים, Playbooks מומלצים.
/predict
מתי להשתמש: כשצריך תחזית חריגות ב-3 השעות הקרובות.
פרמטרים: ללא
הרשאות: כולם
מה לחפש בפלט: מגמת latency/error (🔴/🟢/⚪), ”confidence“, התרעות צפויות.
/accuracy
מתי להשתמש: לבחון את דיוק מודל החיזוי לאורך זמן.
פרמטרים: אופציונלי
window=<days>(ברירת מחדל 7)הרשאות: כולם
מה לחפש בפלט: אחוז התאמות, FP/FN יומיים, הערות על drift אם קיים.
/rate_limit
מתי להשתמש: לבדוק את מכסת GitHub API והצריכה העכשווית.
פרמטרים: ללא
הרשאות: מנהלים בלבד (עם throttling)
מה לחפש בפלט: remaining/limit/reset_time לכל מחלקה (core/search/graph), התרעות על backoff.
/enable_backoff
מתי להשתמש: להכריח את המערכת לעבור למצב חסכון בקריאות GitHub (למשל בעת rate limit נמוך).
פרמטרים: אופציונלי
reason=<text>הרשאות: מנהלים בלבד
מה לחפש בפלט: אישור מצב חדש, timeouts שיוחלו, רמז כיצד לבטל.
/disable_backoff
מתי להשתמש: לחזור לפעילות רגילה אחרי שהסיכון חלף.
פרמטרים: ללא
הרשאות: מנהלים בלבד
מה לחפש בפלט: אישור ביטול וחיווי שאין throttling פעיל.
/sen
מתי להשתמש: לקבל קישור ישיר ללוח Sentry עבור האירועים החמים.
פרמטרים: אופציונלי
project=<name>אוquery="..."הרשאות: מנהלים בלבד
מה לחפש בפלט: לינקים מוכנים (טלגרם תומך בכפתורים) ומדד severities.
/lang
מתי להשתמש: לזהות במהירות את שפת הקובץ/התוכן בבוט (Source of Truth).
פרמטרים: אופציונלי
<file_name>; ניתן להשיב ב-reply עם קוד או לצרף בלוק ```הרשאות: כולם
מה לחפש בפלט:
languageו-reason(מקור ההכרעה: shebang/סיומת/שם/תוכן).דוגמה:
/lang run
Reply עם:
#!/usr/bin/env bash
python main.py
פלט צפוי:
🧠 שפה: bash
📄 קובץ: `run`
ℹ️ סיבה: shebang (bash/sh)
/lang_debug
מתי להשתמש: דיבוג מפורט של החלטת הדטקטור (conflict name↔content, ”למה text?“).
פרמטרים: אופציונלי
<file_name>; קוד עובר ב-reply/בלוק ``` כמו ב-/lang.הרשאות: כולם
מה לחפש בפלט: shebang, base/ext, אותות Python, סמני Markdown, החלטה סופית.
/dm
מתי להשתמש: שליחת הודעה פרטית למשתמש בודד (למשל להודיע על סטטוס ”פרימיום 💎“).
פרמטרים:
<user_id|@username> <message...>הרשאות: מנהלים בלבד (
ADMIN_USER_IDS)מה לחפש בפלט: חיווי הצלחה/כישלון; במקרה של חסימה יוצג
blocked.
/silence
מתי להשתמש: השתקה זמנית של התראה/תבנית בזמן תחזוקה או תחקור.
פרמטרים:
<name|pattern> <duration> [reason...] [severity=<level>] [--force]הרשאות: מנהלים בלבד (עם throttling)
מה לחפש בפלט: מזהה ההשתקה, זמן תפוגה, האם הופעלה בכוח (
--force).דוגמה:
/silence "High Latency" 2h reason=maintenance
/unsilence
מתי להשתמש: ביטול השתקה קיימת לפי מזהה או תבנית.
פרמטרים:
<silence_id|pattern>הרשאות: מנהלים בלבד
מה לחפש בפלט: אישור מחיקה, ואם לא נמצא – הודעה מפורטת.
/silences
מתי להשתמש: אינבנטורי של כל ההשתקות הפעילות כדי לוודא שאין השתקה שנשכחה.
פרמטרים: אופציונלי
limit=<n>(ברירת מחדל 50)הרשאות: מנהלים בלבד
מה לחפש בפלט: מזהה, pattern, severity, זמן סיום.
/cache_stats
מתי להשתמש: לבדוק האם Redis פעיל ומה ה-hit-rate העדכני.
פרמטרים: ללא
הרשאות: כולם (אם יש Redis)
מה לחפש בפלט: enabled/disabled, used_memory, connected_clients, Hit Rate עם אמוג’י מצב.
/clear_cache
מתי להשתמש: לנקות את הקאש האישי (למשל אחרי שינוי הרשאות או קבצים רבים).
פרמטרים: ללא
הרשאות: כולם
מה לחפש בפלט: מספר הערכים שנמחקו והערה שהפעולות הבאות יהיו מעט איטיות עד שהקאש יתמלא מחדש.
/cache_warm
מתי להשתמש: לחמם מראש את קאש
/api/statsעבור המשתמש כדי לזרז טעינות בדשבורד.פרמטרים: ללא
הרשאות: כולם (דורש חיבור DB תקין)
מה לחפש בפלט: ”✅ קאש חומם“ או הודעת שגיאה אם DB לא זמין.
/cache_clear_stale
מתי להשתמש: כשאחוז ה-RAM בשרת מזנק בגלל Redis וצריך ניקוי עדין של מפתחות שפג תוקפם.
פרמטרים: אופציונלי
max=<סריקות>ו-ttl=<שניות>(ברירת מחדל 1000 / 60).הרשאות: מנהלים בלבד (מכבד SAFE_MODE ו-
DISABLE_CACHE_MAINTENANCE).מה לחפש בפלט: מספר המפתחות שנמחקו, הערה אם SAFE_MODE חסם את ההרצה.
/debug_cache
מתי להשתמש: בזמן תחקור Hit Rate נמוך, כדי לראות בלוגים של פעולות cache (HIT/MISS/SET) לפי מפתח.
פרמטרים:
<seconds>(מספר שלם בשניות).0מכבה.הרשאות: מנהלים בלבד
מה לחפש בפלט: הודעה שהדיבאג הופעל/כובה +
debug_until(UTC). בזמן החלון הזה יופיעו בשרת לוגיםcache HIT/MISS/SET key=....
/status_worker
מתי להשתמש: בזמן חשד לעומס בתורים/Push Worker כדי לוודא שה-sidecar מגיב.
פרמטרים: אופציונלי
url=<https://worker>אוpath=/healthz.הרשאות: מנהלים בלבד.
מה לחפש בפלט: סטטוס HTTP ו-latency של
/healthz, חיווי האםPUSH_REMOTE_DELIVERY_ENABLEDו-PUSH_DELIVERY_TOKENמוגדרים.
/version_history
מתי להשתמש: לבדוק האם התרעה קרתה מיד אחרי Deployment ולצרף פרטי actor/request_id.
פרמטרים: אופציונלי
limit=<n>(ברירת מחדל 5) ו-hours=<חלון>(ברירת מחדל 6h).הרשאות: מנהלים בלבד.
מה לחפש בפלט: טבלת זמנים של Deployment events, כולל actor/request_id ולינק להמשך בדיקת observability.