الانتقال إلى المحتوى الرئيسي

Z.ai (Zhipu GLM)

POST https://api.z.ai/api/paas/v4/chat/completions
تدفق SSE متوافق مع OpenAI مع استدعاء الأدوات. يُبثّ الاستدلال بصيغة reasoning_content، ويُتحكَّم بالتفكير عبر thinking: { type } (مع reasoning_effort في GLM-5)، وتُبلَّغ إصابات ذاكرة التخزين المؤقت ضمن usage.prompt_tokens_details.cached_tokens — التنسيق نفسه المستخدم في Kimi. استدلال GLM يختلف حسب النموذج — تكشف نماذج GLM-5 عن مستويات جهد حقيقية (إيقاف / عالٍ / أقصى عبر reasoning_effort)، بينما GLM-4.x مفتاح تشغيل/إيقاف بسيط (أي وضع غير none يُفعّل الاستدلال، وnone يُعطّله). كما يوفّر GLM-5.2 نافذة سياق بمليون رمز، وهي الأكبر في تشكيلة Z.ai. الأفضل لـ: العمل الوكيلي الموفّر للتكلفة، وسير العمل طويل السياق (GLM-5.2)، والمهام التي تتطلب الرؤية. نماذج GLM متعددة الاستخدامات وقوية في سلاسل الأدوات والبرمجة بأسعار الفئة الاقتصادية.

الحصول على مفتاح API

  1. اذهب إلى z.ai
  2. سجّل حسابًا أو سجّل الدخول
  3. افتح API Keys وأنشئ مفتاحًا جديدًا
  4. الصقه في وولف فيش ← الإعدادات ← النماذج ← Z.ai

النماذج

النموذجالسياقالأوضاعإدخال / إخراج (لكل مليون رمز)المخزّن مؤقتًا
glm-5.21Mإيقاف / عالٍ / أقصى1.40/1.40 / 4.40$0.26
glm-5.1200Kإيقاف / عالٍ / أقصى1.40/1.40 / 4.40$0.26
glm-5-turbo200Kإيقاف / عالٍ / أقصى1.20/1.20 / 4.00$0.24
glm-5200Kإيقاف / عالٍ / أقصى1.00/1.00 / 3.20$0.20
glm-4.7200Kإيقاف / تشغيل0.60/0.60 / 2.20$0.11
glm-4.6200Kإيقاف / تشغيل0.60/0.60 / 2.20$0.11
glm-4.5128Kإيقاف / تشغيل0.60/0.60 / 2.20$0.11
glm-4.5-air128Kإيقاف / تشغيل0.20/0.20 / 1.10$0.03

أوضاع الاستدلال

تتحكّم أيقونة الدماغ بجوار صندوق الرسائل في طريقة استدلال النموذج. اضغط عليها للتنقّل بين الأوضاع التي يدعمها النموذج المحدّد. تجتمع هنا فكرتان منفصلتان:

التفكير — هل يفكّر النموذج

  • إيقاف — يجيب النموذج فورًا. الأسرع والأرخص؛ مثاليّ للمهام البسيطة والمباشرة.
  • تشغيل — يعالج النموذج المسألة أولًا في مرحلة استدلال مخصّصة قبل الردّ. أبطأ ويستهلك رموزًا أكثر، لكنه أدقّ بوضوح في المهام متعدّدة الخطوات أو المنطقية أو الغامضة.

الجهد — إلى أي مدى يفكّر

تُتيح هذا النماذج التي تدعم الجهد فقط، ويُطبَّق عندما يكون التفكير مُفعّلًا.
  • عالٍ — عمق استدلال قياسي. الخيار الافتراضي المناسب لمعظم المهام.
  • أقصى — يفكّر النموذج لفترة أطول وأعمق لأصعب المسائل. رموز وكمون أكثر مقابل جودة أعلى في الأعمال المعقّدة.

حالات الزر

الحالةاللونالمعنى
إيقافرماديالتفكير متوقّف — إجابة مباشرة
تشغيلأزرقالتفكير مُفعّل — دون تحكّم بالجهد
عالٍبنفسجيالتفكير مُفعّل، جهد قياسي
أقصىبرتقاليالتفكير مُفعّل، أقصى جهد
يعرض كل نموذج الحالات التي يدعمها فعليًا فقط. إذا كان النموذج يفكّر دائمًا (لا يمكن إيقافه) أو لا يملك تحكّمًا بالجهد، فإن الزر يعكس ذلك ويُقفَل حيث لا يوجد ما يتغيّر. يحفظ Wolffish اختيارك لكل نموذج. في Z.ai: تدعم نماذج GLM-5 الأوضاع إيقاف / عالٍ / أقصى (مستويات جهد حقيقية). أما GLM-4.x فهي مفتاح تشغيل / إيقاف بسيط دون تحكّم بالجهد.