المزودون
يتواصل وولف فيش مع نماذج اللغة الكبيرة عبر تسعة مزودين سحابيين أصليين، ومُجمّع (OpenRouter)، وخيار محلي (Ollama)، جميعها باستخدام fetch() خالص — بدون أي SDK. لكل مزود تنسيق تدفق خاص به واتفاقية استدعاء أدوات خاصة به، يوحدها wernicke.ts في واجهة واحدة. جميع المزودين السحابيين يدعمون استدعاء الأدوات بدون حد أقصى لعددها.
اختيار المزوّد
جميع المزودين السحابيين يتعاملون مع المهام الوكيلية — بما في ذلك سلاسل الأدوات المعقدة متعددة الخطوات. الفرق هو التكلفة مقابل السقف.
الطبقة الاقتصادية — DeepSeek وMiMo وQwen وKimi وMiniMax وStepfun تتعامل مع المهام الوكيلية المعقدة بشكل جيد — سلاسل أدوات طويلة متعددة الخطوات، وسير عمل البحث، وتوليد الأكواد، والأتمتة المستقلة. يجب أن تكون خيارك الافتراضي. بتكلفة أقل بـ 5–25 ضعفًا من الطبقة المتميزة. ابدأ هنا وارتقِ فقط إذا وجدت أن التنفيذ غير موثوق بما يكفي لسير عمل محدد.
الطبقة المتوسطة — xAI تقع بين الاقتصادي والمتميز، تقدم نماذج Grok باستدلال قوي ورؤية وتوليد أكواد بأسعار معتدلة.
الطبقة المتميزة — Anthropic وOpenAI تقدمان أقوى قدرة نموذجية. يتفوق Claude Opus 4.8 وGPT-5.5 حيث تقصر الطبقة الاقتصادية — خاصة computer-use (التفاعل مع الشاشة)، الذي يدعمه Anthropic فقط، والحالات الحرجة حيث لا يكون التنفيذ على النماذج الأرخص كافيًا.
| الطبقة | المزوّد | النموذج الرئيسي | إدخال / إخراج (لكل مليون رمز) | الأفضل لـ |
|---|
| اقتصادي | DeepSeek | deepseek-v4-pro | 0.44/0.87 | الافتراضي لمعظم المهام الوكيلية |
| اقتصادي | MiMo | mimo-v2.5-pro | 0.20/2.00 | الأرخص، متعدد اللغات |
| اقتصادي | Qwen | qwen3.7-max | 2.50/7.50 | تشكيلة واسعة، flash فائق الرخص |
| اقتصادي | Kimi | kimi-k2.6 | 0.95/4.00 | استدلال قوي، سياق طويل |
| اقتصادي | MiniMax | MiniMax-M3 | 0.30/1.20 | استدلال وبرمجة |
| اقتصادي | Stepfun | step-3.7-flash | 0.83/6.94 | استدلال دائم |
| اقتصادي | Z.ai | glm-4.6 | 0.60/2.20 | نماذج GLM، رائد بسياق مليون رمز |
| متوسط | xAI | grok-4.3 | 1.25/2.50 | استدلال، رؤية، برمجة |
| متميز | Anthropic | claude-opus-4-8 | 5.00/25.00 | المهام الأصعب، computer-use |
| متميز | OpenAI | gpt-5.5 | 5.00/30.00 | المهام الأصعب، معرفة واسعة |
| محلي | Ollama | متنوع | مجاني | الخصوصية، احتياطي دون اتصال |
متى تنتقل للطبقة المتميزة
- Computer-use / التفاعل مع الشاشة — يدعمها Anthropic فقط؛ لا بديل
- التنفيذ غير موثوق بما يكفي — إذا جربت مهمة على DeepSeek أو MiMo والوكيل يفشل باستمرار، انتقل إلى Anthropic أو OpenAI لذلك السير المحدد
توصيتنا
ابدأ بـ DeepSeek أو MiMo. يتعاملان مع المهام الوكيلية المعقدة — سلاسل أدوات طويلة، وسير عمل بحث، وتوليد أكواد، وأتمتة مستقلة — بجزء من التكلفة. جرّب سير عملك الفعلي. إذا لم ينفذ سير عمل محدد بموثوقية، انتقل إلى Anthropic أو OpenAI لتلك المهمة. معظم المستخدمين يجدون أنهم نادرًا ما يحتاجون لذلك.
اضبط DeepSeek أو MiMo كمزوّدك الأساسي وضع Anthropic أو OpenAI كاحتياطي. تدرج وولف فيش يتعامل مع هذا تلقائيًا — تنفيذ اقتصادي افتراضيًا مع شبكة أمان متميزة.
DeepSeek (موصى به)
POST https://api.deepseek.com/chat/completions
يستخدم تدفق SSE بتنسيق أدوات متوافق مع OpenAI.
DeepSeek V4 Pro هو الخيار الموصى به افتراضيًا للمهام الوكيلية في وولف فيش. بعد تخفيض السعر الدائم بنسبة 75% (مايو 2026)، يقدم استدلالًا بمستوى حدودي بتكلفة أقل بـ 29–34 ضعفًا من النماذج الحدودية المنافسة على أحمال الإخراج — مع مطابقة أو تجاوز أدائها الوكيلي. كما أنه مرخّص بـ MIT، فيمكنك استضافته ذاتيًا بتكلفة $0 إن كانت لديك البنية التحتية.
الأفضل لـ: سير العمل الوكيلي متعدد الخطوات، استدعاء الأدوات، سلاسل البحث، الأتمتة اليومية الفعّالة من حيث التكلفة.
إذا كنت تُعدّ وولف فيش لأول مرة وتريد مزوّدًا واحدًا يفعل كل شيء — استدعاء أدوات موثوق، استدلال قوي، ردود سريعة، تكلفة ضئيلة — ابدأ بـ DeepSeek V4 Pro. يمكنك دائمًا إضافة Anthropic أو OpenAI لاحقًا لحالات استخدام محددة.
الحصول على مفتاح API
- اذهب إلى platform.deepseek.com
- سجّل حسابًا أو سجّل الدخول
- انتقل إلى API Keys وأنشئ مفتاحًا جديدًا
- الصقه في وولف فيش ← الإعدادات ← النماذج ← DeepSeek
النماذج
| النموذج | السياق | الإخراج الأقصى | الأوضاع | إدخال / إخراج (لكل مليون رمز) | ملاحظات |
|---|
| deepseek-v4-pro | 1M | 32K | بدون، عالي، أقصى | 0.44/0.87 | الموصى به افتراضيًا. أداء وكيلي حدودي. تخزين مؤقت: $0.01/م.رمز. |
| deepseek-v4-flash | 1M | 32K | بدون، عالي، أقصى | 0.14/0.28 | سريع ورخيص. تخزين مؤقت: $0.003/م.رمز. |
Xiaomi MiMo
POST https://api.xiaomimimo.com/v1/chat/completions
يستخدم تدفق SSE بتنسيق أدوات متوافق مع OpenAI. يدعم الرؤية (صور base64) ومستندات بي دي اف.
بعد تخفيض Xiaomi الدائم للأسعار بنسبة تصل إلى 99% — لتطابق أسعار DeepSeek V4 Pro — يعد MiMo V2.5 من أرخص المزودين السحابيين المتاحين.
الأفضل لـ: سير العمل الوكيلي الاقتصادي، المهام متعددة اللغات، سلاسل أدوات متعددة الخطوات، الأتمتة عالية الحجم.
الحصول على مفتاح API
- اذهب إلى platform.xiaomimimo.com
- سجّل حسابًا أو سجّل الدخول
- انتقل إلى API Keys وأنشئ مفتاحًا جديدًا
- الصقه في وولف فيش ← الإعدادات ← النماذج ← Xiaomi Mimo
النماذج
| النموذج | السياق | الإخراج الأقصى | الأوضاع | إدخال / إخراج (لكل مليون رمز) | ملاحظات |
|---|
| mimo-v2.5-pro | 1M | 64K | بدون، عالي | 0.20/2.00 | أفضل نموذج MiMo. استدلال قوي ومتعدد اللغات. |
| mimo-v2.5 | 1M | 32K | بدون، عالي | 0.08/0.80 | توازن جيد بين الجودة والتكلفة. |
| mimo-v2-flash | 256K | 16K | بدون، عالي | 0.01/0.30 | رخيص للغاية للمهام عالية الحجم. |
Kimi (Moonshot AI)
POST https://api.moonshot.ai/v1/chat/completions
يستخدم تدفق SSE بتنسيق أدوات متوافق مع OpenAI. يدعم الرؤية ومحتوى الاستدلال.
الأفضل لـ: سير العمل الوكيلي، المهام ذات السياق الطويل، أحمال العمل المكثفة بالاستدلال.
الحصول على مفتاح API
- اذهب إلى platform.moonshot.ai
- سجّل حسابًا أو سجّل الدخول
- انتقل إلى API Keys وأنشئ مفتاحًا جديدًا
- الصقه في وولف فيش ← الإعدادات ← النماذج ← Kimi
النماذج
| النموذج | السياق | الإخراج الأقصى | الأوضاع | إدخال / إخراج (لكل مليون رمز) | ملاحظات |
|---|
| kimi-k2.6 | 256K | 64K | بدون، عالي | 0.95/4.00 | الأحدث. رؤية + استدلال. |
| kimi-k2.5 | 256K | 64K | بدون، عالي | 0.60/3.00 | رؤية + استدلال. |
| moonshot-v1-128k | 128K | 16K | — | 2.00/5.00 | سياق طويل. |
MiniMax
POST https://api.minimaxi.chat/v1/chat/completions
يستخدم تدفق SSE بتنسيق أدوات متوافق مع OpenAI. يدعم محتوى الاستدلال.
الأفضل لـ: أحمال العمل المكثفة بالاستدلال، توليد الأكواد، سير العمل الوكيلي. يبقى DeepSeek وMiMo أرخص وأكثر قدرة لمعظم أحمال العمل.
الحصول على مفتاح API
- اذهب إلى platform.minimaxi.chat
- سجّل حسابًا أو سجّل الدخول
- انتقل إلى API Keys وأنشئ مفتاحًا جديدًا
- الصقه في وولف فيش ← الإعدادات ← النماذج ← MiniMax
النماذج
| النموذج | السياق | الإخراج الأقصى | الأوضاع | إدخال / إخراج (لكل مليون رمز) | ملاحظات |
|---|
| MiniMax-M3 | 1M | 64K | بدون، عالي | 0.30/1.20 | الأحدث. استدلال قوي. |
| MiniMax-M2.7 | 200K | 32K | — | 0.30/1.20 | الجيل السابق. |
| MiniMax-M2.5 | 200K | 32K | — | 0.30/1.20 | توازن بين الجودة والتكلفة. |
Qwen (علي بابا كلاود)
POST https://dashscope-intl.aliyuncs.com/compatible-mode/v1/chat/completions
يستخدم تدفق SSE بتنسيق أدوات متوافق مع OpenAI. يدعم الرؤية ومحتوى الاستدلال.
الأفضل لـ: سير العمل الوكيلي الاقتصادي، توليد الشفرة البرمجية، المهام متعددة اللغات.
الحصول على مفتاح API
- اذهب إلى qwencloud.com
- سجّل حسابًا أو سجّل الدخول
- انتقل إلى API Keys وأنشئ مفتاحًا جديدًا
- الصقه في وولف فيش ← الإعدادات ← النماذج ← Qwen
النماذج
| النموذج | السياق | الإخراج الأقصى | الأوضاع | إدخال / إخراج (لكل مليون رمز) | ملاحظات |
|---|
| qwen3.7-max | 1M | 64K | بدون، عالي، أقصى | 2.50/7.50 | الرائد. استدلال حدودي. |
| qwen3.7-plus | 1M | 64K | بدون، عالي، أقصى | 0.40/1.60 | استدلال قوي بسعر متوسط. |
| qwen3.5-flash | 1M | 64K | بدون، عالي، أقصى | 0.06/0.24 | استدلال فائق الرخص. |
| qwen3-coder-plus | 131K | 32K | بدون، عالي، أقصى | 0.40/1.60 | مُحسّن للشفرة البرمجية. |
Stepfun
POST https://api.stepfun.ai/v1/chat/completions
يستخدم تدفق SSE بتنسيق أدوات متوافق مع OpenAI. يدعم الرؤية ومحتوى الاستدلال.
الأفضل لـ: المهام المكثفة بالاستدلال التي تتطلب تفكير النموذج دائمًا.
الحصول على مفتاح API
- اذهب إلى platform.stepfun.ai
- سجّل حسابًا أو سجّل الدخول
- انتقل إلى API Keys وأنشئ مفتاحًا جديدًا
- الصقه في وولف فيش ← الإعدادات ← النماذج ← Stepfun
النماذج
| النموذج | السياق | الإخراج الأقصى | الأوضاع | إدخال / إخراج (لكل مليون رمز) | ملاحظات |
|---|
| step-3.7-flash | 128K | 32K | دائم | 0.83/6.94 | الأحدث. استدلال حدودي. |
| step-3.5-flash | 128K | 32K | دائم | 0.83/6.94 | استدلال سريع. |
Z.ai (Zhipu GLM)
POST https://api.z.ai/api/paas/v4/chat/completions
تدفق SSE متوافق مع OpenAI مع استدعاء الأدوات — التنسيق نفسه المستخدم في Kimi. تفكير GLM ثنائي (مُفعّل/مُعطّل، دون مستويات جهد)، ويوفّر GLM-5.2 نافذة سياق بمليون رمز.
الأفضل لـ: العمل الوكيلي الموفّر للتكلفة وسير العمل طويل السياق.
الحصول على مفتاح API
- اذهب إلى z.ai
- سجّل حسابًا أو سجّل الدخول
- افتح API Keys وأنشئ مفتاحًا جديدًا
- الصقه في وولف فيش ← الإعدادات ← النماذج ← Z.ai
النماذج
| النموذج | السياق | الإخراج الأقصى | الأوضاع | إدخال / إخراج (لكل مليون رمز) | ملاحظات |
|---|
| glm-4.6 | 200K | 64K | تفكير مُفعّل/مُعطّل | 0.60/2.20 | موصى به. حصان عمل موفّر. |
| glm-4.5-air | 128K | 64K | تفكير مُفعّل/مُعطّل | 0.20/1.10 | الأرخص. |
| glm-5.2 | 1M | 64K | تفكير مُفعّل/مُعطّل | 1.40/4.40 | الرائد. أكبر سياق. |
للاطلاع على تشكيلة GLM الكاملة وتفاصيل كل نموذج، راجع صفحة Z.ai.
Anthropic (Claude)
POST https://api.anthropic.com/v1/messages
يستخدم تدفق SSE. تصل استدعاءات الأدوات ككتل محتوى tool_use.
الأفضل لـ: الاستدلال المعقد، واتباع التعليمات التفصيلية، والاستخدام الدقيق للأدوات، وcomputer-use (التفاعل مع الشاشة).
الحصول على مفتاح API
- اذهب إلى console.anthropic.com
- سجّل حسابًا أو سجّل الدخول
- انتقل إلى API Keys وأنشئ مفتاحًا جديدًا
- الصقه في وولف فيش ← الإعدادات ← النماذج ← Anthropic
النماذج
| النموذج | السياق | الإخراج الأقصى | الأوضاع | إدخال / إخراج (لكل مليون رمز) | ملاحظات |
|---|
| claude-opus-4-8 | 1M | 32K | بدون، عالي، أقصى | 5.00/25.00 | الأحدث. استدلال حدودي. |
| claude-sonnet-4-6 | 1M | 64K | بدون، عالي، أقصى | 3.00/15.00 | أفضل توازن بين الجودة والتكلفة. |
| claude-haiku-4-5 | 200K | 8K | بدون، عالي | 1.00/5.00 | سريع ورخيص. غير موصى به للمهام الوكيلية. |
Anthropic هو المزوّد الوحيد الذي يدعم computer-use (التفاعل مع الشاشة). إن احتجت أن يقود وولف فيش متصفحًا أو واجهة سطح مكتب، تحتاج مفتاح Anthropic.
xAI (Grok)
POST https://api.x.ai/v1/chat/completions
يستخدم تدفق SSE بتنسيق أدوات متوافق مع OpenAI. يدعم الرؤية ومحتوى الاستدلال.
الأفضل لـ: سير العمل المكثف بالاستدلال، توليد الشفرة البرمجية، مهام الرؤية.
الحصول على مفتاح API
- اذهب إلى console.x.ai
- سجّل حسابًا أو سجّل الدخول
- انتقل إلى API Keys وأنشئ مفتاحًا جديدًا
- الصقه في وولف فيش ← الإعدادات ← النماذج ← xAI
النماذج
| النموذج | السياق | الإخراج الأقصى | الأوضاع | إدخال / إخراج (لكل مليون رمز) | ملاحظات |
|---|
| grok-4.3 | 1M | 64K | بدون، عالي، أقصى | 1.25/2.50 | الرائد. رؤية + استدلال. |
| grok-build-0.1 | 256K | 32K | بدون، عالي، أقصى | 1.00/2.00 | مُحسّن للشفرة البرمجية. |
| grok-3-mini | 131K | 32K | بدون، عالي | 0.30/0.50 | سريع ورخيص. |
OpenAI (GPT)
POST https://api.openai.com/v1/chat/completions
يستخدم تدفق SSE. تصل استدعاءات الأدوات ككائنات function_call.
الأفضل لـ: المهام العامة، والمعرفة الواسعة، والردود السريعة.
الحصول على مفتاح API
- اذهب إلى platform.openai.com
- سجّل حسابًا أو سجّل الدخول
- انتقل إلى API Keys وأنشئ مفتاحًا جديدًا
- الصقه في وولف فيش ← الإعدادات ← النماذج ← OpenAI
النماذج
| النموذج | السياق | الإخراج الأقصى | الأوضاع | إدخال / إخراج (لكل مليون رمز) | ملاحظات |
|---|
| gpt-5.5 | 1M | 64K | بدون، عالي، أقصى | 5.00/30.00 | الرائد. استدلال قوي. |
| gpt-5.4-mini | 1M | 64K | بدون، عالي، أقصى | 0.75/4.50 | استدلال سريع. |
| gpt-5.4-nano | 1M | 64K | بدون، عالي، أقصى | 0.20/1.25 | استدلال فائق الرخص. |
OpenRouter (مُجمّع)
POST https://openrouter.ai/api/v1/chat/completions
يستخدم تدفق SSE بتنسيق أدوات متوافق مع OpenAI. يوجّه الطلبات إلى أي نموذج من أي مزوّد عبر مفتاح API واحد.
OpenRouter هو مُجمّع نماذج — نقطة نهاية API واحدة تُوكّل الطلبات إلى Anthropic وOpenAI وDeepSeek وQwen وxAI وMeta وMistral وGoogle وعشرات غيرهم. مفتاح واحد، فاتورة واحدة، وصول لكل شيء.
نوصي بضبط المزودين مباشرة كلما أمكن. التكامل المباشر يمنحك زمن استجابة أقل (بدون قفزة وسيطة)، وتتبع تكاليف دقيق، وميزات خاصة بالمزوّد (التخزين المؤقت العابر في Anthropic، وFIM في DeepSeek)، وبدون هامش وسيط. يضيف OpenRouter طبقة توجيه قد تزيد زمن الاستجابة وتسبب سلوكًا غير متسق أحيانًا.استخدم OpenRouter عندما تريد تجربة نماذج لم تُعدّها مباشرة، أو كبديل مناسب لمزودين لا تريد إدارة مفتاح API منفصل لهم.
الحصول على مفتاح API
- اذهب إلى openrouter.ai
- سجّل حسابًا أو سجّل الدخول
- انتقل إلى Keys وأنشئ مفتاحًا جديدًا
- الصقه في وولف فيش ← الإعدادات ← النماذج ← OpenRouter
النماذج المدعومة
يدعم OpenRouter مئات النماذج. يُطابق وولف فيش حدود الإخراج مع حدود كل مزوّد أصلي:
| النموذج (عبر OpenRouter) | الإخراج الأقصى | ملاحظات |
|---|
| anthropic/claude-* | 32K | يطابق حدود Anthropic الأصلية. |
| openai/gpt-5* | 64K | يطابق حدود OpenAI الأصلية. |
| openai/o3، openai/o4 | 64K | نماذج استدلال. |
| deepseek/* | 32K | يطابق حدود DeepSeek الأصلية. |
| x-ai/grok-* | 32K | يطابق حدود xAI الأصلية. |
| google/gemini-* | 64K | نماذج Google Gemini. |
| meta-llama/* | 16K | نماذج Meta Llama. |
| qwen/* | 32K | يطابق حدود Qwen الأصلية. |
| mistralai/* | 32K | نماذج Mistral. |
إذا كنت تستخدم بالفعل DeepSeek أو Anthropic أو أي مزوّد مدعوم أصليًا، أبقِ على الاتصال المباشر. أضف OpenRouter فقط لنماذج لا يمكنك الوصول إليها مباشرة. تدرج وولف فيش يتعامل مع الانتقال تلقائيًا — المزودون المباشرون يُجرَّبون أولًا.
Ollama (محلي)
POST http://localhost:11434/api/chat
يستخدم تدفق NDJSON. تصل استدعاءات الأدوات كـ JSON مُهيكَل في الاستجابة. لا حاجة لمفتاح API — يعمل بالكامل على جهازك. راجع دليل تكامل Ollama لمتطلبات النماذج وتوصيات العتاد.
الأفضل لـ: الخصوصية، والاستخدام دون اتصال، والتجريب بلا تكلفة، والبديل المتوفر دائمًا.
تتبع الصحة
يتتبع thalamus صحة كل مزود بشكل مستقل:
- عدد الإخفاقات — يزيد عند كل طلب فاشل
- فترة التهدئة — تراجع أسّي بعد الإخفاقات
- فحص الاتصال —
net.isOnline() للكشف الفوري عن وضع عدم الاتصال
عندما يفشل مزود، يدخل فترة تهدئة قبل أن تُعاد محاولته. يتخطى التدرج المزودين غير الأصحاء وينتقل مباشرة إلى التالي المتاح.
اختيار مزود أساسي
اضبط مزودك الأساسي في الإعدادات أو في config.json. يتدرج بهذا الترتيب: DeepSeek → MiMo → Kimi → MiniMax → xAI → Qwen → Stepfun → Claude → OpenAI → OpenRouter → Ollama (يتخطى غير المُعدّين). تُجرَّب مزودك الأساسي أولًا، ثم يتولى التدرج عند الفشل.
جميع المزودين اختياريون — تحتاج واحدًا مُعدًّا على الأقل. إن استخدمت مزودي السحابة فقط، يتخطى التدرج Ollama. إن استخدمت Ollama فقط، يكون هو المزوّد الوحيد.
للحصول على أفضل تجربة، أبقِ Ollama يعمل مع نموذج مُنزَّل كشبكة أمان. حتى لو كنت تستخدم Claude في المقام الأول، فإن وجود بديل محلي يعني أنك لن تعلق أبدًا بلا رد عند انقطاع الاتصال.