פרויקט בן-יהודה

ברוכים הבאים.  להלן תשובות למספר שאלות שכיחות לגבי הפרויקט:

מהו פרויקט בן-יהודה?

פרויקט בן-יהודה הוא מיזם התנדבותי שפועל מאז שנת 1999, ועוסק ביצירת מהדורות אלקטרוניות של נכסי הספרות העברית וריכוזן באתר אינטרנט לטובת הציבור, בחינם ובאופן חופשי לשימוש.  לעולם לא יידרש תשלום תמורת השימוש במאגר, ולא תוצגנה פרסומות בדפי האתר.  המאגר הינו חופשי בשימוש, ופירוש הדבר שאין צורך לתאם כל שימוש בחומר עם פרויקט בן-יהודה.  כבר היום משתמשים באתר סטודנטים, חוקרים, מורים, תלמידים, וחובבי ספרות באשר הם.

 

הפרויקט שואב את השראתו מפרויקט מקביל בשפה האנגלית (ולאחרונה בשפות נוספות) הנקרא פרויקט גוטנברג – יוזמה של פרופסור מייקל ס' הארט.  הנה קישור למידע נוסף אודות הפרויקט הלועזי.

האם אין כאן הפרה של זכויות יוצרים?

לא.  עורכי הפרויקט מקפידים הקפדה יתרה בנושא זכויות היוצרים, ורק יצירות שהן ברשות הציבור (ר' להלן) יכללו בפרויקט, או יצירות שבהן קיבלנו רשות מפורשת (מאת בעל הזכויות) להשתמש.

אילו יצירת נכללות בפרויקט?

המטרה השאפתנית במודע היא להביא את כלל היצירה העברית אל האינטרנט, מתוך החומר הנמצא ברשות הציבור, לפי חוק זכויות יוצרים.  בימים אלו אנו עובדים על המחברים המופיעים בדף הפתיחה.

מה עם טשרניחובסקי? אלתרמן? גולדברג? עמיחי? וכו'

חוק זכויות יוצרים בישראל קובע הגנה למשך שבעים שנה מסוף שנת מות המחבר.  היות שמחברים אלו נפטרו לפני פחות משבעים שנה, לא נוכל לפרסם מיצירותיהם כחוק ללא רשות מפורשת מבעלי הזכויות.

מדוע אי-אפשר ללחוץ על חלק מהיצירות כדי לראותם?

אנו משתדלים להעלות את החומר בשלבים, על-מנת שמירב היצירות יהיו זמינות כמה שיותר מהר.  פירוש הדבר שלגבי חלק מהיוצרים לא הספקנו להקליד את כל החומר.  חומר מוכן הוא קישורית (הצבועה בכחול, ברוב הדפדפנים), וחומר שאינו מוכן צבוע בשחור ואינו לחיץ.

כיצד מגיע החומר לאתר?

בצורה ידנית:  אחד ממתנדבי הפרויקט מעתיק אותו מן הספר או מסריקה של ספר אל קובץ של מעבד תמלילים, שעובר לאחר מכן הסבה לקובץ HTML ומועלה לאתר.  עיקר העבודה הוא, כמובן, בהעתקת הטקסט, וליתר דיוק בניקודו (במקרה של שירה).

 

מדוע העתקה ידנית? מדוע לא לסרוק את הטקסטים ולהציג אותם כקבצים גרפיים?

משום שקבצי גרפיקה אינם מאפשרים חיפוש ועיבוד בידי מחשב.  יתרון גדול של הפרויקט הוא אפשרות החיפוש אם זכורה לך רק שורה מתוך היצירה, לא בהכרח כותרתה או שם מחברה, עדיין תוכל למצוא אותה.


מדוע לא להשתמש בתוכנות זיהוי תוים אופטיות (
OCR) ?

ראשית, אין תוכנות כאלו המופצות בחינם, ורכישת רשיונות שימוש של התוכנות המסחריות לכלל המתנדבים בפרויקט כרוכה בכסף רב.  לפרויקט אין אפשרות לממן רשיונות שימוש כרגע.  בנוסף על כך, התרשמותנו היא שעדיין  אין בשוק תוכנת OCR התומכת בזיהוי ניקוד מלא, מה גם שהטקסטים שאיתם אנו עובדים הם לעתים קרובות בני למעלה ממאה שנה, הדפים כהים וצהובים, והדפוס לא ברור.

כיצד ניתן לעזור בפרויקט?

ניתן להצטרף כמתנדב לפרויקט, או להרים תרומה כספית.  העזרה מתבטאת, ככלל, בהעתקת, עריכת, והגהת הטקסטים. ראו דף העזרה.

האם הגישה לאתר הפרויקט כרוכה בתשלום?

לא.  היצירות חופשיות לשימושו של כל אדם, לרבות שימוש מסחרי, אלא אם צוין אחרת (כמו ביצירות רגלסון, המאירי, שטיין, ועוד), שאז כל הזכויות שמורות והחומר מותר רק לשימוש אישי לצורך קריאה, לימוד או מחקר.  אנו מבקשים שתסייעו לנו להפיץ את בשורת הפרויקט, בכך שתציינו את כתובת האתר כמקור אם תעשו שימוש בטקסטים ממנו בעבודות אקדמיות למשל.