ניטור
ניטור הוא היכולת להבין מה מתרחש בתוך מערכת דרך התבוננות בסימנים החיצוניים שלה. זוהי ההרגל לראות קשרי סיבה ותוצאה עוד לפני שהם הופכים לסימפטומים. זהו אותו חלק בפרקטיקה ההנדסית שהופך את «משהו נשבר» ל«אנחנו יודעים בדיוק מה נשבר ולמה». אנחנו עושים את הפרויקטים שלנו, וחשוב לנו לשים לב לבעיות מוקדם יותר מהמשתמשים. באופן אידיאלי ברגע שבו זו עדיין סטייה קטנה של מטריקה, הרבה לפני שזה הופך לאירוע עם שיחות טלפון באמצע הלילה.



מה אנחנו רואים כניטור טוב
ניטור טוב עונה על השאלה «למה והיכן בדיוק». הוא מאיר את מסע המשתמש, מראה דגרדציה, מגלה רגרסיה אחרי העלאה לאוויר, ונותן אפשרות לחזור אחורה בשקט. הוא שותק בעניינים קטנים ומדבר חזק כשזה באמת נחוץ. ניטור גרוע הוא עשר התראות שאיש לא מסתכל עליהן, דשבורד עם שלושים גרפים שבו אי אפשר למצוא דבר, לוגים בטקסט שטוח שלא ניתן לסנן. טוב הוא שלוש מטריקות שמתארות באמת את בריאות המערכת, יחד עם לוגים מובנים שחיפוש בהם אורך שניות. אנחנו אוהבים את גישת «שלושת העמודים» — מטריקות, לוגים, מעקבים. מטריקות עונות על «מה קורה בממוצע», לוגים עונים על «מה קרה ברגע מסוים», מעקבים עונים על «איך בקשה עברה דרך המערכת». כל עמוד שימושי כשלעצמו. הקסם מתחיל כשהם מקושרים זה לזה: מהתראה על מטריקה אתה קופץ ללוגים, מהלוגים למעקב, מהמעקב לקוד.
ניטור frontend פרטי
אהבה נפרדת אצלנו היא ניטור frontend פרטי. אתה רואה שגיאות וביצועים אמיתיים בדפדפן, והנתונים נשארים בתוך התשתית שלך. בלי העברה לשירותי צד שלישי, בלי תלות נוספת, בלי שהמשתמשים שלך יהפכו לתנועה עבור מודל הפרסום של מישהו אחר. אנחנו מרכיבים סטאק על בסיס Grafana Faro, OpenTelemetry ובקאנד משלנו לקליטת אירועים. פתרון כזה עולה יותר מאשר לחבר SaaS בחמש דקות. שנה אחר כך יש לך תשתית שעובדת ללא תלות חיצונית, ללא מגבלות על אירועים, עם עלות בעלות שניתן לחזותה.

כשאותות ה־backend וה־frontend חיים יחד, אתה מפסיק לתפור נתונים ידנית ומתחיל לראות את כל המערכת במבט אחד.
התראות כפרקטיקה הנדסית
להגדיר התראה זה קל. לכוונן אותה כך שתופעל רק כשבאמת נדרשת פעולה זה קשה. אנחנו פועלים לפי הכלל: התראה שהופעלה ולא דרשה שום פעולה היא התראה גרועה. אולי הסף מוגדר מן הצד. אולי המטריקה נבחרה בצורה לא מוצלחת. אולי הבעיה כבר נפתרה אוטומטית, והאדם מקבל הודעה לשווא. לכן אצלנו כל התראה עוברת דרך מסנן: מה בדיוק הופר, למה זה חשוב, איזו פעולה מצופה, לאן להסתכל. כשיש תשובות ברורות לשאלות הללו, ההתראה נשארת. התראות כאלה מופעלות לעיתים נדירות ותמיד לעניין.
כיצד זה בא לידי ביטוי בפרויקטים שלנו
אנחנו אוספים אותות כך שיסייעו לקבל החלטות: אילו ניסויים להריץ, מה לייעל, היכן צוואר הבקבוק, כמה עולה שגיאה. במקומות שבהם זה עוזר, אנחנו מוסיפים דרכים מהירות לתייג אירועים וניסויים, כדי להחליף אמונה בידיעה. במוצרים עם תנועת משתמשים יש לנו כברירת מחדל פאנל עם Core Web Vitals, פירוט לפי מדינות ומכשירים, ומבט נפרד על «הזנב» של ההתפלגות — משום שממוצעים כמעט תמיד משקרים. בשירותי backend יש לנו tracing לאורך כל השרשרת, שבלעדיו אי אפשר להבין למה בקשה ספציפית לקחה שבע שניות. אם אתה רוצה לעבור מ«נראה שזה החמיר» ל«הנה המטריקה, הנה הסיבה, הנה רגע הרגרסיה» — זה בדיוק הסגנון שלנו.
סטטוס
היכולת פעילה וגדלה יחד עם הפרויקטים שלנו — כי בלי ניטור כל מערכת מורכבת הופכת במהרה לנדודים. אנחנו מוכנים לקחת פרויקטים מאפס (להקים את הסטאק, להגדיר התראות, ללמד את הצוות) ומשימות של פירוק גן חיות קיים של דשבורדים: מה להשאיר, מה להסיר, מה להחליף. כלי אורתודוכסי לחיפוש ולימוד טקסטים מהכתובים. חיפוש מהיר, השוואת תרגומים, פרשנויות ומצב לילדים.
חיפוש בתנ"ך