في الآونة الأخيرة صار كثير من الناس يشعرون بأن أدوات الذكاء الاصطناعي لم تعد «سخية» كما كانت: بعض الاشتراكات بدأت تعدّل الحصص، وبعض النماذج صار يستهلك نقاطًا أكثر، وبعض الخدمات صار من الأسهل أن تفعّل القيود في أوقات الذروة، وبعض المنتجات قد يوقف حتى استقبال المستخدمين الجدد. التفسير الأكثر بداهة هو: الشركات بدأت تحصد الأرباح؛ انتهت إعانات المرحلة الأولى، والآن تريد دفع المستخدمين نحو باقات أغلى.
هذا التفسير فيه قدر من الواقعية، لكنه قد يضيّق زاوية النظر كثيرًا. التغيّر الأهم ليس أن «شركات الذكاء الاصطناعي قررت فجأة أن تكسب بضعة دولارات إضافية»، بل أن اقتصاد الذكاء الاصطناعي ينتقل من منافسة الإعانات في البدايات إلى مرحلة تُقيّده القدرة الحاسوبية أكثر. بمعنى آخر: الندرة الحقيقية ليست سعر الاشتراك على الصفحة (20 أو 100 أو 200 دولار)، بل سعة الـ GPU/TPU الكامنة خلفه القادرة على معالجة الطلبات على عنقود النماذج المناسب وفي الوقت المناسب.
الفكرة الخاطئة الأولى: اعتبار «عدد الرسائل» هو التكلفة الحقيقية
أسهل ما يفهمه المستخدم العادي هو «كم رسالة أستطيع إرسالها في الشهر». لكن بالنسبة لمزوّد الخدمة، تكلفة رسالة قد تختلف تمامًا عن تكلفة أخرى.
سؤال بسيط قد ينتهي خلال ثوانٍ ويستهلك عددًا قليلًا من الـ token؛ بينما مهمة تطوير معقدة قد تجعل النموذج يستنتج لفترة طويلة، ويقرأ ويكتب كودًا، ويستدعي أدوات، ويشغّل اختبارات—وفارق التكلفة قد يقفز من بضعة سنتات إلى عدة دولارات، بل وأكثر. إذا كان التسعير يعتمد فقط على «عدد الرسائل»، ستظهر مشكلة: المستخدمون الخفيفون يدعمون المستخدمين الكثيفين، كما أن المنصة لا تستطيع التنبؤ بكم موارد الاستدلال التي سيحرقها كل مشترك.
لذلك بدأت كثير من أدوات المطورين تنتقل من «عدد رسائل ثابت» إلى أساليب قياس أقرب لاستهلاك الموارد الحقيقي. قد لا يعني هذا أن التجربة أصبحت أفضل، لكنه أقرب إلى الواقع الاقتصادي.
الفكرة الخاطئة الثانية: الظن أن وضع حدود يعني مجرد رفع السعر
بعض الخدمات تعدّل الحصص في ساعات الذروة، أو تدفع المستخدمين الكثيفين إلى الاستخدام خارج الذروة. يبدو ذلك على السطح وكأنه «أعطت أقل»، لكن المنطق السفلي أقرب إلى جدولة السعة في الحوسبة السحابية.
إذا كانت المنصة تمتلك عددًا ثابتًا من وحدات GPU، ودخل عملاء الشركات والمستخدمون ضمن الفرق والمشتركون الأفراد في الوقت نفسه خلال الذروة، فعليها أن تقرر من له الأولوية. المستخدم الفردي يقدّم اشتراكًا شهريًا ثابتًا، لكن عملاء الشركات غالبًا يدفعون مقابل API والعقود وعزل البيانات واتفاقيات مستوى الخدمة، وقيمة العميل الواحد أعلى ومتطلباته أشد. من غير الغريب أن تُعطي المنصة الأولوية لهؤلاء.
ولهذا ترى بعض المنتجات تفضّل إيقاف التسجيل، أو تقييد نماذج معينة، أو تغيير معامل/معدل استخدام النماذج المتقدمة، بدلًا من أن تجعل العملاء الحاسمين غير قادرين على الاستخدام في أوقات الذروة. ليست القضية أنهم لا يريدون البيع، بل أن القدرة الحاسوبية لا تكفي للبيع.
الفكرة الخاطئة الثالثة: الشركات الكبرى لديها مال، إذن يمكنها الإعانة بلا حدود
المال مهم، لكنه لا يتحول فورًا إلى قدرة حاسوبية قابلة للاستخدام. وحدات GPU المتقدمة، وذاكرة الفيديو، ومراكز البيانات، والكهرباء، والشبكات، وسلاسل الإمداد، ونشر النماذج—كلها تحتاج وقتًا. حتى أغنى الشركات لا تستطيع مضاعفة القدرة الحاسوبية المتاحة عالميًا للذكاء الاصطناعي بين ليلة وضحاها.
هذا يفسر ظاهرة غير بديهية: مع أن الجميع «شركات كبرى»، بعضها يبدو وكأنه لا يزال يقدم الكثير من ميزات الذكاء الاصطناعي مجانًا، بينما يبدأ بعضها الآخر بتشديد الحصص مبكرًا. لكن «المجاني» لا يعني بلا تكلفة. ملخصات الذكاء الاصطناعي في البحث، والتجارب المجانية، واستدعاءات النماذج المدمجة داخل أدوات التطوير—كلها في جوهرها إعانات قدرة حاسوبية. الفرق أن الإعانة تكون مخفية داخل أعمال أكبر، وقد لا يراها المستخدم العادي.
عندما تكون الإعانة مفرطة، ويتضخم الطلب، وتضيق تكلفة النماذج وسعة العتاد معًا، يحدث سحب الإعانة بسرعة. الفارق فقط: بعض الشركات تشدّد مبكرًا، وبعضها يتحرك أبطأ بسبب المنظومة، أو السمعة، أو عقود الشركات.
الفكرة الخاطئة الرابعة: سعر اشتراك الفرد يمثّل التكلفة الحقيقية للشركات
كثيرون يقارنون بباقات الأفراد: إذا كنت أدفع عشرات أو مئات الدولارات شهريًا وأستخدم بكثرة، فلماذا تقول الشركات إن تكلفة الذكاء الاصطناعي مرتفعة؟
السبب أن اشتراك الأفراد غالبًا يكون مدعومًا، ومفترضًا للاستخدام الفردي. أما استخدام الشركات عبر API أو عقود المؤسسات فعادة يُحاسَب بحسب الـ token الفعلي، والنموذج، ومعدل النقل (throughput)، واحتفاظ البيانات، والامتثال، ومتطلبات العزل. حجم عمل يبدو «رخيصًا جدًا» داخل اشتراك فردي قد يصبح أغلى بكثير على فاتورة API الخاصة بالشركة.
ولهذا عندما تبدأ الشركات بنشر الذكاء الاصطناعي داخليًا، قد تتضخم الميزانيات بسرعة. ليس لأن الجميع يسيء الاستخدام، بل لأن كل استدعاء للنموذج في بيئة المؤسسة يكون أقرب إلى التسعير الحقيقي، بلا طبقة الإعانة العازلة التي يوفرها اشتراك الأفراد.
الفكرة الخاطئة الخامسة: النظر إلى سعر الـ token فقط، وليس تكلفة إنجاز المهمة كاملة
خطأ شائع آخر هو التحديق في «كم تكلفة كل مليون token». هذا الرقم مفيد لكنه غير كافٍ. ما ينبغي النظر إليه هو: كم التكلفة الإجمالية لإنجاز المهمة نفسها.
قد يكون سعر الـ token في نموذج ما أعلى، لكنه إن كان أفضل في التخطيط، وأقل التفافًا، وأقل تكرارًا لإخراج محتوى غير مفيد، فقد يحتاج في النهاية إلى عدد token أقل لإنهاء المهمة. وعلى العكس، قد يكون نموذج رخيص لكنه يحتاج محاولات كثيرة ويخرج كمية كبيرة من المحتوى غير المجدي، فلا تكون التكلفة الإجمالية أقل بالضرورة.
لذلك لا يمكن تقييم سعر الذكاء الاصطناعي فقط على أساس «كم ثمن حبة العنب»، بل أيضًا «هل حلّت هذه الكيس من العنب مشكلتك». وهذا ينطبق على المستخدمين العاديين أيضًا: ليس كل مهمة تحتاج أغلى وأقوى نموذج. في كثير من السيناريوهات، نموذج متوسط أو منخفض يعطي قيمة مقابل المال أعلى.
تقييم أدق: الطليعة أغلى، والمستوى نفسه من الذكاء أرخص
يبدو أن الذكاء الاصطناعي يصبح أغلى لأن نماذج الطليعة فعلًا تتطلب موارد تدريب واستدلال ونشر أكبر. لكن إذا قست الأمر على أساس «تكلفة الوصول إلى مستوى معيّن من الذكاء»، فالاتجاه ليس متشائمًا. النماذج تصبح أذكى وأكثر كفاءة. قد يحقق نموذج متوسط جديد نتيجة نموذج قديم متقدم، لكنه ينجز المهمة بعدد token أقل ووقت أقل وتكلفة إجمالية أدنى.
هذا يعني أن أمرين سيحدثان معًا: النماذج الأعلى مستوى ستزداد ندرة وغلاء؛ لكن «ذكاء كافٍ» للمهام العادية سيصبح أرخص فأرخص. إذا ظل المستخدم يراقب فقط قيود النماذج الأعلى، سيظن أن اقتصاد الذكاء الاصطناعي ينهار؛ أما إذا نظر إلى سير العمل الفعلي، فسيرى أن القابلية للاستخدام ما زالت تتحسن.
كيف يضبط المستخدم العادي توقعاته
أولًا: لا تعتبر الحصص المجانية أو الرخيصة وعدًا دائمًا. إعانات المرحلة المبكرة كانت لجذب المستخدمين وتدريب السوق والتحقق من الطلب، لا كنموذج اقتصادي طويل الأمد.
ثانيًا: لا تفهم كل تقييد على أنه «المنصة صارت أسوأ». كثيرًا ما يكون الأمر إدارة سعة، لإبقاء القدرة الحاسوبية النادرة للسيناريوهات الأعلى قيمة أو الأعلى يقينًا.
ثالثًا: تعلّم اختيار النموذج بحسب المهمة. كتابة ملخص، أو تحسين نص، أو شرح مفهوم، أو ترتيب معلومات—لا يلزمها أقوى نموذج؛ أما الكود المعقد، أو الاستدلال على سياق طويل، أو التحليل الجاد، فحينها فكّر في نموذج أغلى.
رابعًا: افصل بين المؤسسة والفرد. اشتراك الأفراد مناسب لرفع كفاءة الشخص، لكن بيئة الإنتاج في الشركات تحتاج النظر في تكلفة API، وحدود البيانات، والامتثال، والتدقيق (audit)، واستقرار الخدمة—وهذان ليسا نظام تسعير واحدًا.
خامسًا: عند النظر إلى تكلفة الذكاء الاصطناعي، لا تكتفِ بالاشتراك، أو عدد الرسائل، أو سعر الـ token، بل انظر إلى «كم كلّف إنجاز مهمة حقيقية، وكم وقتًا وفّر، وهل النتيجة موثوقة».
عصر إعانات الذكاء الاصطناعي لم ينتهِ تمامًا، لكن مرحلة الاستخدام غير المقيّد تمضي إلى الزوال. ما سيهم حقًا لاحقًا ليس السؤال: هل قلّلت هذه الباقة حصتها قليلًا؟ بل فهم أن القدرة الحاسوبية تتحول إلى مورد بنية تحتية جديد. من يمتلك قدرة حاسوبية متاحة أكثر، ومن يجدولها بكفاءة أعلى، ومن يجعل النموذج أكثر توفيرًا للـ token—سيملك الأفضلية في المرحلة التالية.
بالنسبة للمستخدم العادي، هذا ليس إشارة إلى أن «الذكاء الاصطناعي انتهى»، بل هو إعادة تسعير لا بد منها عندما ينتقل الذكاء الاصطناعي من لعبة، وموضة، ومنتج مدعوم، إلى بنية تحتية حقيقية.