> ## Documentation Index
> Fetch the complete documentation index at: https://docs.wolffi.sh/llms.txt
> Use this file to discover all available pages before exploring further.

# Z.ai

> إعداد Z.ai — نماذج GLM من Zhipu مع تفكير قابل للتبديل وسياق يصل إلى مليون رمز

# Z.ai (Zhipu GLM)

```
POST https://api.z.ai/api/paas/v4/chat/completions
```

تدفق SSE متوافق مع OpenAI مع استدعاء الأدوات. يُبثّ الاستدلال بصيغة `reasoning_content`، ويُتحكَّم بالتفكير عبر `thinking: { type }` (مع `reasoning_effort` في GLM-5)، وتُبلَّغ إصابات ذاكرة التخزين المؤقت ضمن `usage.prompt_tokens_details.cached_tokens` — التنسيق نفسه المستخدم في Kimi.

**استدلال GLM يختلف حسب النموذج** — تكشف نماذج GLM-5 عن مستويات جهد حقيقية (إيقاف / عالٍ / أقصى عبر `reasoning_effort`)، بينما GLM-4.x مفتاح تشغيل/إيقاف بسيط (أي وضع غير *none* يُفعّل الاستدلال، و*none* يُعطّله). كما يوفّر GLM-5.2 **نافذة سياق بمليون رمز**، وهي الأكبر في تشكيلة Z.ai.

الأفضل لـ: العمل الوكيلي الموفّر للتكلفة، وسير العمل طويل السياق (GLM-5.2)، والمهام التي تتطلب الرؤية. نماذج GLM متعددة الاستخدامات وقوية في سلاسل الأدوات والبرمجة بأسعار الفئة الاقتصادية.

## الحصول على مفتاح API

1. اذهب إلى [z.ai](https://z.ai)
2. سجّل حسابًا أو سجّل الدخول
3. افتح **API Keys** وأنشئ مفتاحًا جديدًا
4. الصقه في وولف فيش ← الإعدادات ← النماذج ← Z.ai

## النماذج

| النموذج     | السياق | الأوضاع             | إدخال / إخراج (لكل مليون رمز) | المخزّن مؤقتًا |
| ----------- | ------ | ------------------- | ----------------------------- | -------------- |
| **glm-5.2** | 1M     | إيقاف / عالٍ / أقصى | $1.40 / $4.40                 | \$0.26         |
| glm-5.1     | 200K   | إيقاف / عالٍ / أقصى | $1.40 / $4.40                 | \$0.26         |
| glm-5-turbo | 200K   | إيقاف / عالٍ / أقصى | $1.20 / $4.00                 | \$0.24         |
| glm-5       | 200K   | إيقاف / عالٍ / أقصى | $1.00 / $3.20                 | \$0.20         |
| glm-4.7     | 200K   | إيقاف / تشغيل       | $0.60 / $2.20                 | \$0.11         |
| glm-4.6     | 200K   | إيقاف / تشغيل       | $0.60 / $2.20                 | \$0.11         |
| glm-4.5     | 128K   | إيقاف / تشغيل       | $0.60 / $2.20                 | \$0.11         |
| glm-4.5-air | 128K   | إيقاف / تشغيل       | $0.20 / $1.10                 | \$0.03         |

## أوضاع الاستدلال

تتحكّم أيقونة **الدماغ** بجوار صندوق الرسائل في طريقة استدلال النموذج. اضغط عليها للتنقّل بين الأوضاع التي يدعمها النموذج المحدّد. تجتمع هنا فكرتان منفصلتان:

### التفكير — *هل* يفكّر النموذج

* **إيقاف** — يجيب النموذج فورًا. الأسرع والأرخص؛ مثاليّ للمهام البسيطة والمباشرة.
* **تشغيل** — يعالج النموذج المسألة أولًا في مرحلة استدلال مخصّصة قبل الردّ. أبطأ ويستهلك رموزًا أكثر، لكنه أدقّ بوضوح في المهام متعدّدة الخطوات أو المنطقية أو الغامضة.

### الجهد — *إلى أي مدى* يفكّر

تُتيح هذا النماذج التي تدعم الجهد فقط، ويُطبَّق عندما يكون التفكير مُفعّلًا.

* **عالٍ** — عمق استدلال قياسي. الخيار الافتراضي المناسب لمعظم المهام.
* **أقصى** — يفكّر النموذج لفترة أطول وأعمق لأصعب المسائل. رموز وكمون أكثر مقابل جودة أعلى في الأعمال المعقّدة.

### حالات الزر

| الحالة | اللون   | المعنى                            |
| ------ | ------- | --------------------------------- |
| إيقاف  | رمادي   | التفكير متوقّف — إجابة مباشرة     |
| تشغيل  | أزرق    | التفكير مُفعّل — دون تحكّم بالجهد |
| عالٍ   | بنفسجي  | التفكير مُفعّل، جهد قياسي         |
| أقصى   | برتقالي | التفكير مُفعّل، أقصى جهد          |

يعرض كل نموذج الحالات التي يدعمها فعليًا فقط. إذا كان النموذج يفكّر دائمًا (لا يمكن إيقافه) أو لا يملك تحكّمًا بالجهد، فإن الزر يعكس ذلك ويُقفَل حيث لا يوجد ما يتغيّر. يحفظ Wolffish اختيارك لكل نموذج.

**في Z.ai:** تدعم نماذج GLM-5 الأوضاع إيقاف / عالٍ / أقصى (مستويات جهد حقيقية). أما GLM-4.x فهي مفتاح تشغيل / إيقاف بسيط دون تحكّم بالجهد.