ביג דאטה והמחקר הבלשני: מבט חדש על המין הדקדוקי במערכת המספר

Authors

  • נורית מלניק

Keywords:

מין דקדוקי, שם המספר, התאם, קורפוס, ביג דאטה, שיטות מחקר

Abstract

היכולת לאסוף, לאחסן ולעבד כמויות עצומות של נתונים הביאה עימה מושג חדש – ביג דאטה – ועימו גם תחום חדש שמתמחה בהפקת ידע ותובנות ממאגר נתונים ענק באמצעות כלים סטטיסטיים. תחום זה נוגע בכל תחומי חיינו ויש הטוענים שהוא לא רק מחליף שיטות מחקר מסורתיות אלא אף מייתר את השיטה המדעית המוכרת ואת הצורך בְּיֶדַע תְּחוּמִי (domain knowledge), במודלים ובתיאוריות. מאמר זה דן בקשר בין ביג דאטה לבין המחקר הבלשני, ובייחוד באופן שבו אפשר לרתום נתונים הנאספים כנתוני עתק לקידום הידע על אודות תופעות לשוניות. בתור מקרה מבחן נדונה שאלת המין הדקדוקי במערכת המספר בעברית; באילו שיטות נקטו מחקרים קודמים כדי להבין את השינויים החלים על המערכת ומה התמונה שחושף מחקר המבוסס על ביג דאטה.

לסיכום, למחקר שתי תרומות עיקריות: ראשית, נתוני הקורפוס שימשו לצורך בחינה מחודשת של תוצאות מחקרים קודמים שנתוניהם נאספו בשיטות מסורתיות. הממצאים העלו ספק בנוגע להיקף התופעה ואף הפריכו במידה רבה השערות שהועלו בספרות. שנית, תהליך מוּנע נתונים עשה שימוש בכלי ניתוח חישוביים כדי להתחקות אחר תופעות שמשתקפות מהנתונים. כתוצאה מכך נחשפו דגמים וקשרים שלא ניכרו מקומץ הנתונים שנאסף עד כה, נוסחו מחדש השערות קודמות והוצעו תובנות חדשות. הגישה שהוצגה במאמר זה אינה רואה בביג דאטה שינוי פרדיגמה ומחליף פוטנציאלי לשיטה המדעית, אלא להיפך. השילוב של שיטות מחקר המבוססות על ביג דאטה במחקר הבלשני יתרום להעשרת הידע וההבנה שלנו לגבי תופעות לשוניות.

Downloads

Published

2024-08-26