בעשור האחרון הפכה האינטליגנציה המלאכותית (AI) לזירה מרכזית של חדשנות טכנולוגית ושל התקדמות עסקית. מודלים גדולים דוגמת GPT, BERT ו-DALL-E שינו לחלוטין את הדרך בה אנו צורכים מידע, יוצרים תוכן ומנהלים אינטראקציה עם טכנולוגיה. הם הפכו לכלי עזר עוצמתיים עבור עסקים, מפתחים וצרכנים פרטיים. אך לצד ההתקדמות, צץ אתגר משמעותי שמלווה כל מערכת מבוססת בינה מלאכותית – ההטיות (Biases) במודלים הגדולים.
הבעיה: מאיפה מגיעה ההטיה?
לכל אלגוריתם למידת מכונה יש בסיס עיקרי – הנתונים עליהם הוא מתאמן. הנתונים הללו משקפים, במודע או שלא במודע, את הערכים וההעדפות של האנשים שאספו אותם או בנו את המערכות שמייצרות אותם. כאשר המידע שנכנס למודל מוטה על פי דעות קדומות, אפליה מגדרית, גזעית או תרבותית, יוצא שגם המודל יציג תוצאות מוטות.
כך למשל, אם מערכת לזיהוי פנים מתאמנת על סט מסויים של תמונות שאינן מכילות ייצוג מספק לבני מיעוטים, היא עלולה להיכשל בזיהוי נכון של הפנים הללו. דוגמה נוספת היא מודלי שפה גדולים שמבטאים תשובות שמחזקות סטריאוטיפים לגבי מגדר, מוצא או גיל.
הטיות מוחבאות: כיצד הן משתלבות בתהליך?
הטיות אינן בהכרח בולטות או מכוונות. לעיתים, גם במערכות שמופעלות ע"י טובי המפתחים, קיימות הטיות ש"מתגנבות" לתוך המודל באמצעות בחירות לא מודעות – אילו נתונים נאספים, אילו לא, על מה נותנים דגש בתהליך האימון, ואילו פרמטרים קובעים את התוצאה הסופית. לעיתים די בכך שהסטטיסטיקה ההיסטורית אינה שוויונית, כדי שהמודל יאחז במציאות הלא שוויונית הזו וימשיך לשעתק אותה לעתיד.
השלכות חברתיות ואתיות
הטיות כאלה עלולות להוביל לפגיעה אמיתית: קבלת החלטות מוטעות בתהליכי גיוס עובדים (למשל, בחירת מועמדים מסוימים על פני אחרים), אפליה בתחום הבריאות (כשמודלים מאבחנים מטופלים לפי נתונים היסטוריים לא מאוזנים), פגיעה בפרטיות ואף עיוות קבלת ההחלטות בתחומים ציבוריים כמו משפט או רשויות רווחה.
מודלים מוטים עלולים אף להרחיק משתמשים מקבוצות מודרות או לייצר מחסומים בלתי נראים להשתלבותן בטכנולוגיה.
מה עושים?
הידע על הטיות והמודעות לקיומן הם השלב הראשון, אך לא מספיקים. יש לשלב בדיקות ואיזונים כבר בשלבי איסוף הנתונים והאימון. מפתחים נדרשים לבדוק האם הנתונים שמולבשים על המודל מגוונים וייצוגיים, לקחת בחשבון טעויות שנוצרות כתוצאה מקשרים סטטיסטיים שטחיים, ואף להטמיע אלגוריתמים שמאזנים תוצאות מוטות.
בנוסף, קיימות היום טכנולוגיות לבחינת "שקיפות" והסבירות של מודלים. בדיקת הוגנות (Fairness) ושלל מבחני הטיה נעשים בכל שלב – מאיסוף הנתונים ועד להטמעה במוצר. חשוב גם לשלב מומחי אתיקה, פסיכולוגיה וחברה בצוותי פיתוח, ולא להותיר את האתגרים רק בידי מהנדסים.
סיכום
מודלים גדולים של בינה מלאכותית מביאים איתם הזדמנויות חסרות תקדים, אך הם משקפים גם את הפערים והחולשות של החברה האנושית. ככל שנזכה למודעות, פיקוח ובקרה טובה יותר, נוכל לבנות מערכות הוגנות, שקופות ומועילות עבור כולם. הדרך לשם אינה פשוטה, אך היא הכרחית להבטיח ש-AI לא ימשיך להנציח – ואף יחמיר – את ההפליה האנושית.