מדיבור לתחביר - מתאוריה לתמליל

שלמה יזרעאל הקדמה : מאגר העברית המדוברת בישראל ( מעמ"ד ) במאמר זה אביא בפני הקורא הרהורים אחדים על דרכי רישום הדיבור לצורכי מחקר . 1 מכיוון שמחקר הלשון הדבורה עודנו בחיתוליו ( ראה מילר וויינרט , , 1998 סעיף ; 1 . 2 2 בייבר ועמיתיו , , 1999 פרק , ( 14 וחקר העברית המדוברת עודנו מצפה לביסוס ראשיתי ( יציב מליבר , , 2002 פרק ; 1 יזרעאל , תשס"ב , א , ( אין בדברים דלהלן אלא שאלות וכיווני חשיבה שעלו תוך כדי קריאה ועבודה . עבודתי בתחום זה נבעה מן הצורך לגבש כללים מנחים להעברת הטקסטים העתידים להיכלל במאגר העברית המדוברת בישראל ( מעמ"ד ) אל ערוץ הכתב . מעמ"ד יכונן כמאגר מייצג . כדי להבטיח ייצוג אמין של השונות הלשונית , הן זו הדמוגרפית והן זו התלויה בנסיבות השיח , יישמר עקרון האקראיות בעת דגימת הנתונים הטקסטואליים . דגימת נסיבות השיח תתבצע לאחר איסוף כל ההקלטות של האוכלוסייה הנדגמת דגימה דמוגרפית . כל אלה שעלו במדגם האוכלוסין האקראי יתבקשו להקליט את כל הקורות אותם במשך יממה רצופה . כל הקלטה כזאת תיבדק , ויוסרו ממנה מרווחי שתיקה וקטעי דיבור לא ברורים . מן החומר הנקי ייבחר קטע של טקסט באורך של כחצי ...  אל הספר
מוסד ביאליק