עדות

ג'אווה ודעה קדומה - תוכנה מנחשת עדות של משוררים
נא להקליד שם של משורר/ת ישראלי/ת
(כלומר מי שמשויך/כת ל קטגוריה:משוררים ישראלים בוויקיפדיה וחי/ה במדינת ישראל לאחר הקמתה) 
המחשב טועה לעתים, תיקונים ותוספות יתקבלו בברכה.
ערן הדס אוגוסט 2016
המחולל הוא אביזר משלים לספר עדות מאת ערן הדס (ברחש 2016)אודות

הספר עדות הוא תוצר של תוכנת מחשב שמנסה לנחש את מגדרם ואת מוצאם של משוררים ישראלים.

1. רשימת המשוררים נלקחה מתוך עמוד ויקיפדיה בשם קטגוריה:משוררים ישראלים. הרשימה עודכנה ידנית במקרים אחדים. למשל, המשורר נתן זך לא הופיע בה, אולי בגלל פעולה חבלנית מכוונת, ולשלמהחתוכה כלל אין ערך ויקיפדיה. כמו כן ביקשתי ממספר משוררים להוסיף שמות שחסרים להם, והמספר גדל מ-577 בוויקיפדיה ל-655.
2. התוכנה מנסה להסיק את מגדרם של המשוררים לפי הופעה מוקדמת של המחרוזות "משורר"/"משוררת" או "ישראלי"/"ישראלית" בעמוד הוויקיפדיה שלהם.
3. התוכנה מנסה להסיק את מוצאם של המשוררים מתוך עמוד הוויקיפדיה שלהם:
3.1 הופעה של המילים "ערבי" או "ערביה", "פלסטיני" או "פלסטינית", "אתיופי" או "אתיופית", "תוכנה", "רובוט", "רובוטית", "בוט" או "בוטית", "שומרוני" או "שומרונית" בפתיחת הערך גורמת לתוכנה להסיק כי המשורר/ת הוא/היא ממוצא שאנו מדירים משיח העדות.
3.2 הופעה של אחת ממדינות אירופה למעט ספרד, פורטוגל, יוון וטורקיה מעניקה ניקוד למוצא אשכנזי. הופעה של אחת ממדינות אפריקה, הקווקז והמזה"ת (לרבות טורקיה, פורטוגל, ספרד ויוון) מעניקה ניקוד למוצא מזרחי. אם המילים "דור" או "דורות" מופיעה בסמיכות לארץ ישראל ומספר הדורות גדול משלושה, ניתן ניקוד למוצא מזרחי.
3.3 סיומות כמו -שטיין, -שטרן, -יץ', -ברג, -מן, -סון, -באום, או -בוים בשם המשפחה מעניקות ניקוד למוצא אשכנזי.
4. כאשר המחשב לא מצליח להכריע, או כשרמת הביטחון שלו נמוכה, מנחשת קבוצת אנשים ממוצא מעורב את המוצא.
5. לאחר קבלת התוצאות, מתבצע מעבר נוסף על תוצאות החיפוש של המשוררים, ותיקונים מבוצעים בהתאם למידע חדש.
6. התוצאות נשלחות לסבב בדיקות נוסף אצל קבוצת אנשים ממוצא מעורב.

דוגמה: עמיחי חסון.
עמיחי חסון אותר ברשימה.
אותרה המילה "משורר" ולכן הוסק כי עמיחי חסון הוא זכר.
לא אותרו מלים מדירות. אותרה מדינת לוב. אותרה מדינת ארצות הברית אחריה. לא אותרו דורות בארץ. אותרה הסיומת סון. לכן ההימור היה שעמיחי חסון הוא משורר ממוצא מעורב אבל רמת הביטחון נמוכה.
ההימור האנושי היה שעמיחי חסון הוא משורר ממוצא מזרחי.
תוצאות החיפוש בגוגל, יחד עם קריאה אנושית של הערך בוויקיפדיה, אוששו את הטענה שעמיחי חסון הוא משורר ממוצא מעורב.
סבב הבדיקות אישרר את הניחוש: עמיחי חסון הוא משורר ממוצא מעורב.