הערכת אוצר מילים בעברית כשפה שנייה לערבית בעזרת מדד הגיוון הלקסיקלי

182 איהאב ח׳ליל אבו- רביעה בלשנות עברית 78 : תשפ״ה כאמור, הגיוון הלקסיקלי מושפע מאורך הטקסט, על כן הבדיקה נעשתה על 80 התמניות הראשונות בכל חיבור . ההגבלה ל- 80 תמניות נקבעה מכיוון שהחיבור הקצר ביותר בקורפוס – שנכתב בנקודת הזמן השנייה – כלל 80 תמניות . בחיבורים שכללו יותר מ- 80 תמניות, נבחרו 80 התמניות הראשונות לפי הסדר ולא באופן אקראי . 23 החיבורים בנקודת הזמן הראשונה כללו 1840 תמניות, כך גם בנקודת הזמן השנייה . בסך הכול נבדקו 3680 מילים ( tokens / running words ) של כתיבה טיעונית בעברית כ- L2 לתלמידי תיכון דוברי ערבית . 7 . 2 כלי הניתוח הדיגיטליים לחישוב הגיוון הלקסיקלי ישנן שתי שיטות לניתוח של קורפוס : ( א ) השיטה הידנית שבה נבדקים בעיקר קורפוסים קצרים, מאחר שהיא מצריכה השקעת זמן רב ; באופן כללי קריאה של בני אדם דורשת זמן רב וסלקטיביות ( סינקלייר ורוקוול, 2015 ) ; ( ב ) השיטה האוטומטית המאפשרת בדיקת קורפוס ארוך בזמן קצר, אך רמת דיוק הניתוח אינה מיטבית שכן ניתוח אוטומטי מצריך הגדרות רחבות יותר של המילים ופוסח על יסודות רבים בטקסט, כמו צירופי מילים או צירופים כבולים . במחקר זה מדד הגיו...  אל הספר
הוצאת אוניברסיטת בר אילן