Z.ai (Zhipu GLM)

POST https://api.z.ai/api/paas/v4/chat/completions

تدفق SSE متوافق مع OpenAI مع استدعاء الأدوات. يُبثّ الاستدلال بصيغة reasoning_content، ويُتحكَّم بالتفكير عبر thinking: { type } (مع reasoning_effort في GLM-5)، وتُبلَّغ إصابات ذاكرة التخزين المؤقت ضمن usage.prompt_tokens_details.cached_tokens — التنسيق نفسه المستخدم في Kimi. استدلال GLM يختلف حسب النموذج — تكشف نماذج GLM-5 عن مستويات جهد حقيقية (إيقاف / عالٍ / أقصى عبر reasoning_effort)، بينما GLM-4.x مفتاح تشغيل/إيقاف بسيط (أي وضع غير none يُفعّل الاستدلال، وnone يُعطّله). كما يوفّر GLM-5.2 نافذة سياق بمليون رمز، وهي الأكبر في تشكيلة Z.ai. الأفضل لـ: العمل الوكيلي الموفّر للتكلفة، وسير العمل طويل السياق (GLM-5.2)، والمهام التي تتطلب الرؤية. نماذج GLM متعددة الاستخدامات وقوية في سلاسل الأدوات والبرمجة بأسعار الفئة الاقتصادية.

الحصول على مفتاح API

اذهب إلى z.ai
سجّل حسابًا أو سجّل الدخول
افتح API Keys وأنشئ مفتاحًا جديدًا
الصقه في وولف فيش ← الإعدادات ← النماذج ← Z.ai

النماذج

النموذج	السياق	الأوضاع	إدخال / إخراج (لكل مليون رمز)	المخزّن مؤقتًا
glm-5.2	1M	إيقاف / عالٍ / أقصى	$1.40 /$ 4.40	$0.26
glm-5.1	200K	إيقاف / عالٍ / أقصى	$1.40 /$ 4.40	$0.26
glm-5-turbo	200K	إيقاف / عالٍ / أقصى	$1.20 /$ 4.00	$0.24
glm-5	200K	إيقاف / عالٍ / أقصى	$1.00 /$ 3.20	$0.20
glm-4.7	200K	إيقاف / تشغيل	$0.60 /$ 2.20	$0.11
glm-4.6	200K	إيقاف / تشغيل	$0.60 /$ 2.20	$0.11
glm-4.5	128K	إيقاف / تشغيل	$0.60 /$ 2.20	$0.11
glm-4.5-air	128K	إيقاف / تشغيل	$0.20 /$ 1.10	$0.03

أوضاع الاستدلال

تتحكّم أيقونة الدماغ بجوار صندوق الرسائل في طريقة استدلال النموذج. اضغط عليها للتنقّل بين الأوضاع التي يدعمها النموذج المحدّد. تجتمع هنا فكرتان منفصلتان:

التفكير — هل يفكّر النموذج

إيقاف — يجيب النموذج فورًا. الأسرع والأرخص؛ مثاليّ للمهام البسيطة والمباشرة.
تشغيل — يعالج النموذج المسألة أولًا في مرحلة استدلال مخصّصة قبل الردّ. أبطأ ويستهلك رموزًا أكثر، لكنه أدقّ بوضوح في المهام متعدّدة الخطوات أو المنطقية أو الغامضة.

الجهد — إلى أي مدى يفكّر

تُتيح هذا النماذج التي تدعم الجهد فقط، ويُطبَّق عندما يكون التفكير مُفعّلًا.

عالٍ — عمق استدلال قياسي. الخيار الافتراضي المناسب لمعظم المهام.
أقصى — يفكّر النموذج لفترة أطول وأعمق لأصعب المسائل. رموز وكمون أكثر مقابل جودة أعلى في الأعمال المعقّدة.

حالات الزر

الحالة	اللون	المعنى
إيقاف	رمادي	التفكير متوقّف — إجابة مباشرة
تشغيل	أزرق	التفكير مُفعّل — دون تحكّم بالجهد
عالٍ	بنفسجي	التفكير مُفعّل، جهد قياسي
أقصى	برتقالي	التفكير مُفعّل، أقصى جهد

يعرض كل نموذج الحالات التي يدعمها فعليًا فقط. إذا كان النموذج يفكّر دائمًا (لا يمكن إيقافه) أو لا يملك تحكّمًا بالجهد، فإن الزر يعكس ذلك ويُقفَل حيث لا يوجد ما يتغيّر. يحفظ Wolffish اختيارك لكل نموذج. في Z.ai: تدعم نماذج GLM-5 الأوضاع إيقاف / عالٍ / أقصى (مستويات جهد حقيقية). أما GLM-4.x فهي مفتاح تشغيل / إيقاف بسيط دون تحكّم بالجهد.

​Z.ai (Zhipu GLM)

​الحصول على مفتاح API

​النماذج

​أوضاع الاستدلال

​التفكير — هل يفكّر النموذج

​الجهد — إلى أي مدى يفكّر

​حالات الزر