قد تظن للوهلة الأولى أن نماذج الذكاء الاصطناعي (AI) تقرأ الكلمات وتفهم الجمل تماماً كما تفعل أنت عند قراءة هذا النص، لكن الحقيقة التقنية مختلفة وأكثر تعقيداً. خلف واجهات المحادثة السلسة التي نستخدمها يومياً، لا تتعامل الآلة مع “كلمات”، بل تتعامل مع وحدات رقمية مجزأة تُعرف باسم “الرموز” (Tokens).
يمثل فهم هذه الرموز الفارق الجوهري بين المستخدم العادي الذي يطرح الأسئلة فقط، وبين المحترف الذي يعرف كيف يدير “ذاكرة” النموذج وكيف يحسب تكاليف استخدام الواجهات البرمجية (API) بدقة، فهي ليست مجرد وسيلة للمعالجة، بل هي العملة التي يدور حولها اقتصاد الذكاء الاصطناعي الحديث.
كيف تحول الخوارزميات لغتك إلى أرقام
لكي تتمكن النماذج اللغوية الكبيرة (LLMs) من معالجة النصوص، يجب عليها أولاً تكسير اللغة البشرية إلى قطع صغيرة يمكن تحويلها إلى متجهات رياضية. هذه القطع هي ما نسميه “الرموز”. الرمز ليس بالضرورة كلمة كاملة؛ فقد يكون كلمة واحدة، أو جزءاً من كلمة، أو حتى مجرد حرف واحد.
على سبيل المثال، في اللغة الإنجليزية، كلمة بسيطة مثل “apple” قد تُحسب كرمز واحد، بينما كلمة معقدة أو مركبة قد تُقسم إلى رمزين أو ثلاثة. الأمر يختلف في اللغة العربية، حيث تعتمد “الرموز” غالباً على الأحرف أو الجذور بسبب طبيعة اللغة المتصلة والاشتقاقية، مما يجعل عدد الرموز في الجملة العربية أحياناً أعلى منه في ترجمتها الإنجليزية.
هذه التجزئة ليست عشوائية، بل تتبع مكتبات ترميز محددة (Tokenizers) تهدف إلى كفاءة المعالجة. النموذج لا يرى كلمة “مرحباً”، بل يرى سلسلة من الأرقام (مثل: 15496) يمثل هذا الرمز في قاموسه الضخم، ومن هنا يبدأ السحر في توقع الرمز التالي.
ذاكرة النموذج محدودة بمحفظة رموزك
عندما نتحدث عن قدرة نموذج مثل GPT-4 على تذكر سياق المحادثة، فإننا نتحدث فعلياً عن “نافذة السياق” (Context Window)، وهي سعة محدودة تقاس بعدد الرموز لا بعدد الكلمات.
تخيل نافذة السياق كطاولة عمل بمساحة محددة. كلما أضفت نصوصاً جديدة للمحادثة، وضعت “رموزاً” جديدة على الطاولة. عندما تمتلئ الطاولة، يضطر النموذج لإسقاط الرموز الأقدم لفسح المجال للجديد. هذا يفسر لماذا “ينسى” الذكاء الاصطناعي تعليماتك الأولى في المحادثات الطويلة؛ لقد نفدت مساحة الرموز المتاحة لديه.
اقتصاديات الذكاء الاصطناعي والفاتورة الشهرية
بعيداً عن الجانب التقني، تلعب الرموز الدور الحاسم في الجانب المالي. الشركات المطورة مثل “أوبن إيه آي” (OpenAI) أو “جوجل” (Google) لا تحاسب المطورين بناءً على عدد الطلبات، بل بناءً على عدد الرموز المعالجة (مدخلات ومخرجات).
القاعدة التقريبية الشائعة هي أن 1000 رمز يعادل حوالي 750 كلمة باللغة الإنجليزية. يعني هذا أن صياغتك للسؤال (Prompt) بذكاء واختصار لا توفر عليك الوقت فحسب، بل تقلل التكلفة المادية المباشرة لاستخدامك، وتترك مساحة أكبر للنموذج ليقدم إجابة دقيقة دون أن يقتطع من ذاكرته قصيرة المدى. إتقان التعامل مع الرموز هو الخطوة الأولى لتتحول من مستهلك للتقنية إلى مدير ذكي لمواردها.

