נכתב על ידי הגב' אולגה יפרח
לאור השימוש ההולך והגובר בבינה מלאכותית (AI) ולאור מחקר ופיתוח בנושא, עולה הצורך להבין את המצב המשפטי בנוגע לזכות יוצרים בשימוש ביצירות מוגנות לצורך למידת מכונה. לאחרונה, משרד המשפטים התייחס לנושא ופרסם את חוות דעתו בעניין שימושים בתכנים מוגנים בזכויות יוצרים לצורך למידת מכונה. חוות הדעת פורסמה בתאריך 18 לדצמבר 2022 תחת הכותרת "חוות דעת: שימושים בתכנים מוגנים בזכויות יוצרים לצורך למידת מכונה". חוות הדעת נכתבה על ידי עו"ד ד"ר ליטל הלמן, בליווי עו"ד הווארד פולינר, ראש אשכול קניין רוחני ובהנחיית עו"ד כרמית יוליס, המשנה ליועצת המשפטית לממשלה (משפט אזרחי).
למידת מכונה, לצורך פיתוח בינה מלאכותית, מתבצעת על ידי יצירת מאגר מידע הכולל בתוכו תכנים מסוגים שונים, כגון קבצי טקסט, קבצי קול, תמונות, סרטי וידאו וכדומה. לעיתים התכנים אותם יש צורך לצרף למאגר המידע מוגנים והשימוש בהם טעון הפרת זכות יוצרים. השימוש בתכנים המוגנים עלול להביא להפרת הזכות הכלכלית של בעל זכות יוצרים לפי סעיף 11 לחוק זכות יוצרים, תשס"ח-2007 (להלן: "החוק") ולהפרת הזכות המוסרית של היוצר לפי סעיף 46 לחוק.
סעיף 11 לחוק מגדיר כהפרה של זכות יוצרים, בין היתר, פעולות של העתקה, פרסום, ביצוע פומבי, שידור, העמדת היצירה לרשות הציבור, עשיית יצירה נגזרת והשכרה של יצירה. אין ספק ששימוש ביצירה לצורך למידת מכונה כרוך בביצוע חלק מהפעולות המנויות בסעיף 11. מבחינה טכנית, יצירת מאגר מידע כולל העתקה של התכנים, שמירה ולעיתים גם ביצוע שינויים בתכנים ויצירת יצירות נגזרות. לכן שימוש בתכנים מוגנים עלול לחשוף את יוצר המאגר לטענות במספר הפרות של זכות יוצרים לפי סעיף 11 לחוק.
סעיף 46 לחוק מגדיר כהפרה של זכות מוסרית, בין היתר, את אי ציון שמו של היוצר והטלת פגם או שינוי ביצירה. בדרך כלל מאגרי המידע לא מציינים את שם היוצרים של התכנים הכלולים במאגר ואף עושים שינויים ביצירה בדרכים שונות ולכן עלול בעל המאגר להיות חשוף גם לטענה בנוגע להפרת הזכות המוסרים לפי סעיף 46 לחוק.
יחד עם זאת, כדי לאזן בין אינטרס ההגנה על יצירות לבין האינטרס הציבורי בהגברת הגישה ליצירות נקבעו בחוק זכות יוצרים, תשס"ח-2007 מספר סייגים לזכויות של בעלי זכות יוצרים. בהם, טוען משרד המשפטים בחוות דעתו, ניתן להשתמש כדי להתיר שימוש בתכנים מוגים ללמידת מכונה – ברוב המקרים, אך לא בכל המקרים.
דוקטרינת השימוש ההוגן מעוגנת בישראל בסעיף 19 לחוק. זהו לשון הסעיף:
שימוש הוגן
19. (א) שימוש הוגן ביצירה מותר למטרות כגון אלה: לימוד עצמי, מחקר, ביקורת, סקירה, דיווח עיתונאי, הבאת מובאות, או הוראה ובחינה על ידי מוסד חינוך.
(ב) לצורך בחינה של הוגנות השימוש ביצירה לעניין סעיף זה, יישקלו, בין השאר, כל אלה:
(1) מטרת השימוש ואופיו;
(2) אופי היצירה שבה נעשה השימוש;
(3) היקף השימוש, מבחינה איכותית וכמותית, ביחס ליצירה בשלמותה;
(4) השפעת השימוש על ערכה של היצירה ועל השוק הפוטנציאלי שלה.
(ג) השר רשאי לקבוע תנאים שבהתקיימם ייחשב שימוש לשימוש הוגן.
כפי שעולה מסעיף 19 לחוק, כדי ששימוש ביצירה מוגנת ייהנה מהגנת השימוש ההוגן, עליו לעמוד בשני תנאים מצטברים. ראשית, עליו להיעשות למטרה מאלה המנויות בסעיף קטן א' או "כגון אלה". שנית, עליו להבחן על פי מבחני השימוש ההוגן המנויים בסעיף קטן ב'.
שימוש הוגן לפי סעיף 19(א), כולל מטרה של "לימוד עצמי". מיזם של למידת מכונה משתמש בתכנים לצורך למידת מכונה. ניתן לראות את ההבחנה בין למידת מכונה לבין למידה אנושית כעניין טכני בלבד אשר אינו רלוונטי לתכלית הסעיף לכן המושג "לימוד עצמי" כולל בתוכו גם למידת מכונה.
בנוסף, ניתן לראות ביצירה של מאגרי מידע כמתאימה גם לגדר המטרה של "מחקר", גם בגלל התהליך של בחירה, אפיון וניתוח התכנים הנבחרים להיכלל במאגר וגם משום שנושא של בינה מלאכותית נמצא עדיין בשלבי מחקר.
גם אם השימוש בתכנים מוגנים לא תואם, במקרים מסוימים, בהתאמה מושלמת את המושגים "לימוד עצמי" ו"מחקר" הרי המחוקק השאיר פתח על ידי שימוש בביטוי "כגון אלה" בסעיף 19(א), לכן לא נדרשת התאמה מלאה.
כאמור, בנוסף לשימוש הוגן יש לבחון את מטרת השימוש ואופיו המופיע בסעיף 19(ב)(1) לחוק. מטרת השימוש בתכנים היא יצירה של מאגר מידע יעיל ואיכותי עבור למידת מכונה. יצירת מאגר מידע היא קריטית כדי שמיזמי בינה מלאכותית יצליחו. על פי הפסיקה, אופי השימוש נבחן לאור השאלה אם השימוש שנעשה ביצירה הוא שימוש ביצירה כפי שהיא, או שהוא מהווה שימוש טרנספורמטיבי, שימוש המשנה את היצירה. ככל שהשימוש הוא טרנספורמטיבי יותר, כך נחשב הוא "הוגן" יותר ולתועלת הציבור. תהליך למידת מכונה אכן ברוב המקרים הינו בעל ערך חברתי וטרנספורמטיבי ומשנה בתכלית את הקשרה של היצירה המקורית.
חשוב לציין שאם המצב הוא לא כזה, כאשר היצירה כמעט ולא משתנה ובנוסף לכך מטרת השימוש היא מסחרית, המסקנה שתתקבל, ככל הנראה, שמיזם מסוג זה לא עומד בסעיף 19(ב)(1) והשימוש בתכנים מוגנים נוטה לכיוון אי-הוגנות השימוש.
השיקול השני בבחינת הוגנות השימוש, על פי סעיף 19(ב)(2) לחוק, בוחן את אופי היצירה שבה נעשה השימוש. באיזו סוג יצירה מדובר: שימוש ביצירה ספרותית או מוסיקלית עשוי להבחן בקפדנות יתרה לעומת שימוש בשידור או בהקלטה. כמו כן, שימוש ביצירות המבוססות על עובדות ונתונים או ביצירות הנושאות אופי מחקרי יסווגו כשימוש הוגן ביתר קלות לעומת יצירות מבוססות פרי דמיונו של היוצר.
השיקול השלישי בבחינת הוגנות השימוש, על פי סעיף 19(ב)(3) לחוק, בוחן את היקף השימוש ביצירה מבחינה איכותית וכמותית. אף על פי שהיצירה המוגנת לרוב מועתקת למאגר המידע בכללותה, דבר העלול להצביע על שימוש שאינו שימוש הוגן, הדבר נעשה לא כדי להשתמש בביטוי היצירתי הגלום ביצירה אלא כדי שהמכונה תוכל להשתמש בנתונים, עובדות, מבנה, רעיונות וכדומה מתוך היצירה. הלמידה עצמה מתבצעת לא מהיצירה בכללותה אלא מחלקים ממנה בלבד, מה שמחזק את הוגנות השימוש בה לצורך זה.
השיקול הרביעי בבחינת הוגנות השימוש, על פי סעיף 19(ב)(4) לחוק, בוחן את השפעת השימוש על השוק של היצירה ועל השוק הפוטנציאלי שלה. המצב היום, בארץ ובעולם, הוא כי שוק של יצירות מוגנות אינו קיים. אין פלטפורמה אחת שמרכזת את כל היצירות המוגנות וניתן לרכוש באמצעותה רישיון שימוש בהן. לכן, בעלי מאגרי מידע לא יכולים לשלם עבור כל המידע המוגן גם אם הם רוצים. לאתר כל בעל זכות יוצרים ולנהל איתו משא ומתן על רכישת זכויות שימוש ביצירה זהו דבר בלתי אפשרי היום ואף עלול לפגוע בפיתוח תחום הבינה המלאכותית. לכן השפעת השימוש על השוק היא מינורית אך המחיר של אי שימוש בתכנים מוגנים עבור תחום פיתוח הבינה המלאכותית הוא גדול מאוד.
שיקול מרכזי נוסף שיש להביא בחשבון בניתוח הוגנות השימוש הוא גיוון התכנים. יש הבדל משמעותי בין מאגר המורכב מתכנים של יוצרים מגוונים לבין מאגר המורכב מיצירתו של יוצר בודד בלבד שבאמצעותו לומדת המערכת את סגנונו המסוים של היוצר. ככל שמאגר המידע יהא מגוון יותר, יתחזק הטיעון בדבר השימוש ההוגן.
ישנם הסדרים נוספים בחוק זכות יוצרים אשר עשויים להצדיק שימוש בתכנים מוגנים ללמידת מכונה והם שימוש אגבי ביצירה (לפי סעיף 22 לחוק) והעתקה זמנית (סעיף 26 לחוק). ניתן לראות בהעתקת התכנים למאגר הנתונים שימוש אגבי בתכנים. ריבוי היצירות המרכיבות את המאגר גורם לכל יצירה פרטנית במאגר הנתונים להוות רכיב זניח ואגבי בלמידה. הגנת העתקה זמנית תחול במקרים בהם מאגר המידע נמחק בתום השימוש בו.
ומה בדבר הפרת זכות מוסרית? אין ממש בטענות בדבר הפרתה במאגרי מידע של למידת מכונה. אין היא חלה על כל סוגי היצירות והיא אינה זכות מוחלטת. זכות היוצר כי שמו יקרא על יצירתו (זכות הייחוס) תלויה "בהיקף ובמידה הראויים בנסיבות העניין", וזכותו של היוצר כי יצירתו לא תשונה (זכות השלמות) תחול רק אם יש בשינוי "כדי לפגוע בכבודו או בשמו של היוצר". עמדת משרד המשפטים היא כי פרשנות התנאי בדבר ה"היקף והמידה הראויים" לצורך זכות הייחוס צריכה להיות צרה ביותר, וכי שינוי יצירה בתהליך יצירת מאגר הנתונים צריך להתפרש ככזה שאין בו "כדי לפגוע בכבודו או בשמו של היוצר". בנוסף, העדרו של קהל אנושי מייתר את האינטרס של היוצר במתן קרדיט ואת החשש לפגיעה בכבודו עקב שינוי היצירה.
אכן ניתן לראות כי פרשנות ההגנות בחוק זכות יוצרים עשויה לאפשר שימוש בתכנים מוגנים במאגרי מידע המשמשים ללמידת מכונה.
משרד המשפטים התייחס בחוות דעתו גם לשאלת הצורך לעדכן את חוק זכויות יוצרים כדי לכלול סעיף ספציפי המתייחס ללמידת מכונה. מסקנתו היתה שהטכנולוגיות מתפתחות בקצב מסחרר ועדכוני החוק במרחב הטכנולוגי לא יעמדו בקצב השינויים הטכנולוגיים לכן עדיף להסתמך על עקרונות כלליים ולא ספציפיים.
לקריאת המסמך המלא – ראו מטה.
machine-learning