التحديات التي يواجهها الذكاء الاصطناعي في المهام البسيطة: كيف تؤثر آليات التوكينيزايشن على دقته؟
شهدت روبوتات الذكاء الاصطناعي مؤخرًا تطورًا كبيرًا بفضل قدراتها الواسعة، التي تعتمد على نماذج اللغة الكبيرة، مما يمكنها من توليد نصوص مشابهة لما يكتبه البشر، فضلاً عن قدرتها على كتابة الأكواد البرمجية، والإجابة على الأسئلة، وحل التحديات.
على الرغم من هذه القدرات المدهشة، التي قد تحاكي البشر في بعض الأحيان، إلا أن هذه النماذج ما زالت تواجه تحديات في بعض المهام البسيطة التي تتطلب التفكير البشري وقدرة على استنتاج المعلومات بشكل دقيق. يظهر هذا بشكل واضح في التحديات التي تتعلق بإحصاء الحروف المتكررة في الكلمات مثل “Strawberry” أو “hippopotamus”، حيث تفشل نماذج الذكاء الاصطناعي في تقديم الإجابة الصحيحة في كل مرة.
ورغم أن الذكاء الاصطناعي قادر على تلخيص النصوص، حل المسائل اللغوية، وكتابة وتصحيح الأكواد البرمجية، إلا أنه يعجز عن إتمام مهمة بسيطة كعد الحروف في كلمة واحدة. ويعود السبب في ذلك إلى آلية عمل الذكاء الاصطناعي، والتي تعتمد على تحويل النصوص إلى رموز رقمية عبر عملية تعرف بـ”التوكينيزايشن” (Tokenization)، وهي آلية تسمح للذكاء الاصطناعي بفهم النصوص من خلال هذه الرموز بدلاً من الحروف والكلمات كما يفعل البشر.
في بعض الحالات، يقوم الذكاء الاصطناعي بتقسيم كلمة مثل “سلسبيل” إلى مقاطع مثل “سلس” و”بيل”، وهو ما يعني أن الذكاء الاصطناعي لا يعامل الحروف الفردية بشكل منفصل، بل يراها جزءًا من المقطع. لذا فإن حروف معينة قد تُعدّ أكثر من مرة بناءً على تقسيم المقاطع، مما يؤدي إلى إجابات خاطئة عند العد.
ومع ذلك، فإن النماذج الاحترافية المدفوعة مثل “GPT-4” استطاعت تخطي هذه العوائق بشكل كبير، بفضل آلية ترميز أكثر دقة تعتمد على المنطق، ما يسمح بفهم الحروف والكلمات بشكل أفضل. لكن هذه النماذج تتطلب موارد أكبر من النماذج المجانية، ما يجعلها أكثر تكلفة.
ورغم وجود هذه العوائق، لا يعني ذلك أن الذكاء الاصطناعي عاجز. على العكس، فإن آلية التوكينيزايشن والمقاطع تتيح له التميز في بعض المجالات مثل البرمجة وكتابة الأكواد، حيث يمكنه توليد نصوص معقدة ودقيقة بناءً على الأوامر المتتالية. لكن لا يزال من الصعب على الذكاء الاصطناعي محاكاة آلية التفكير البشرية في حل المشكلات المعقدة التي تتطلب ربط نتائج متعددة أو التفكير في مراحل متتابعة.