الانتقال إلى المحتوى الرئيسي

المزودون

يتواصل وولف فيش مع نماذج اللغة الكبيرة عبر تسعة مزودين سحابيين أصليين، ومُجمّع (OpenRouter)، وخيار محلي (Ollama)، جميعها باستخدام fetch() خالص — بدون أي SDK. لكل مزود تنسيق تدفق خاص به واتفاقية استدعاء أدوات خاصة به، يوحدها wernicke.ts في واجهة واحدة. جميع المزودين السحابيين يدعمون استدعاء الأدوات بدون حد أقصى لعددها.

اختيار المزوّد

جميع المزودين السحابيين يتعاملون مع المهام الوكيلية — بما في ذلك سلاسل الأدوات المعقدة متعددة الخطوات. الفرق هو التكلفة مقابل السقف. الطبقة الاقتصادية — DeepSeek وMiMo وQwen وKimi وMiniMax وStepfun تتعامل مع المهام الوكيلية المعقدة بشكل جيد — سلاسل أدوات طويلة متعددة الخطوات، وسير عمل البحث، وتوليد الأكواد، والأتمتة المستقلة. يجب أن تكون خيارك الافتراضي. بتكلفة أقل بـ 5–25 ضعفًا من الطبقة المتميزة. ابدأ هنا وارتقِ فقط إذا وجدت أن التنفيذ غير موثوق بما يكفي لسير عمل محدد. الطبقة المتوسطة — xAI تقع بين الاقتصادي والمتميز، تقدم نماذج Grok باستدلال قوي ورؤية وتوليد أكواد بأسعار معتدلة. الطبقة المتميزة — Anthropic وOpenAI تقدمان أقوى قدرة نموذجية. يتفوق Claude Opus 4.8 وGPT-5.5 حيث تقصر الطبقة الاقتصادية — خاصة computer-use (التفاعل مع الشاشة)، الذي يدعمه Anthropic فقط، والحالات الحرجة حيث لا يكون التنفيذ على النماذج الأرخص كافيًا.
الطبقةالمزوّدالنموذج الرئيسيإدخال / إخراج (لكل مليون رمز)الأفضل لـ
اقتصاديDeepSeekdeepseek-v4-pro0.44/0.44 / 0.87الافتراضي لمعظم المهام الوكيلية
اقتصاديMiMomimo-v2.5-pro0.20/0.20 / 2.00الأرخص، متعدد اللغات
اقتصاديQwenqwen3.7-max2.50/2.50 / 7.50تشكيلة واسعة، flash فائق الرخص
اقتصاديKimikimi-k2.60.95/0.95 / 4.00استدلال قوي، سياق طويل
اقتصاديMiniMaxMiniMax-M30.30/0.30 / 1.20استدلال وبرمجة
اقتصاديStepfunstep-3.7-flash0.83/0.83 / 6.94استدلال دائم
اقتصاديZ.aiglm-4.60.60/0.60 / 2.20نماذج GLM، رائد بسياق مليون رمز
متوسطxAIgrok-4.31.25/1.25 / 2.50استدلال، رؤية، برمجة
متميزAnthropicclaude-opus-4-85.00/5.00 / 25.00المهام الأصعب، computer-use
متميزOpenAIgpt-5.55.00/5.00 / 30.00المهام الأصعب، معرفة واسعة
محليOllamaمتنوعمجانيالخصوصية، احتياطي دون اتصال

متى تنتقل للطبقة المتميزة

  • Computer-use / التفاعل مع الشاشة — يدعمها Anthropic فقط؛ لا بديل
  • التنفيذ غير موثوق بما يكفي — إذا جربت مهمة على DeepSeek أو MiMo والوكيل يفشل باستمرار، انتقل إلى Anthropic أو OpenAI لذلك السير المحدد

توصيتنا

ابدأ بـ DeepSeek أو MiMo. يتعاملان مع المهام الوكيلية المعقدة — سلاسل أدوات طويلة، وسير عمل بحث، وتوليد أكواد، وأتمتة مستقلة — بجزء من التكلفة. جرّب سير عملك الفعلي. إذا لم ينفذ سير عمل محدد بموثوقية، انتقل إلى Anthropic أو OpenAI لتلك المهمة. معظم المستخدمين يجدون أنهم نادرًا ما يحتاجون لذلك.
اضبط DeepSeek أو MiMo كمزوّدك الأساسي وضع Anthropic أو OpenAI كاحتياطي. تدرج وولف فيش يتعامل مع هذا تلقائيًا — تنفيذ اقتصادي افتراضيًا مع شبكة أمان متميزة.

DeepSeek (موصى به)

POST https://api.deepseek.com/chat/completions
يستخدم تدفق SSE بتنسيق أدوات متوافق مع OpenAI. DeepSeek V4 Pro هو الخيار الموصى به افتراضيًا للمهام الوكيلية في وولف فيش. بعد تخفيض السعر الدائم بنسبة 75% (مايو 2026)، يقدم استدلالًا بمستوى حدودي بتكلفة أقل بـ 29–34 ضعفًا من النماذج الحدودية المنافسة على أحمال الإخراج — مع مطابقة أو تجاوز أدائها الوكيلي. كما أنه مرخّص بـ MIT، فيمكنك استضافته ذاتيًا بتكلفة $0 إن كانت لديك البنية التحتية. الأفضل لـ: سير العمل الوكيلي متعدد الخطوات، استدعاء الأدوات، سلاسل البحث، الأتمتة اليومية الفعّالة من حيث التكلفة.
إذا كنت تُعدّ وولف فيش لأول مرة وتريد مزوّدًا واحدًا يفعل كل شيء — استدعاء أدوات موثوق، استدلال قوي، ردود سريعة، تكلفة ضئيلة — ابدأ بـ DeepSeek V4 Pro. يمكنك دائمًا إضافة Anthropic أو OpenAI لاحقًا لحالات استخدام محددة.

الحصول على مفتاح API

  1. اذهب إلى platform.deepseek.com
  2. سجّل حسابًا أو سجّل الدخول
  3. انتقل إلى API Keys وأنشئ مفتاحًا جديدًا
  4. الصقه في وولف فيش ← الإعدادات ← النماذج ← DeepSeek

النماذج

النموذجالسياقالإخراج الأقصىالأوضاعإدخال / إخراج (لكل مليون رمز)ملاحظات
deepseek-v4-pro1M32Kبدون، عالي، أقصى0.44/0.44 / 0.87الموصى به افتراضيًا. أداء وكيلي حدودي. تخزين مؤقت: $0.01/م.رمز.
deepseek-v4-flash1M32Kبدون، عالي، أقصى0.14/0.14 / 0.28سريع ورخيص. تخزين مؤقت: $0.003/م.رمز.

Xiaomi MiMo

POST https://api.xiaomimimo.com/v1/chat/completions
يستخدم تدفق SSE بتنسيق أدوات متوافق مع OpenAI. يدعم الرؤية (صور base64) ومستندات بي دي اف. بعد تخفيض Xiaomi الدائم للأسعار بنسبة تصل إلى 99% — لتطابق أسعار DeepSeek V4 Pro — يعد MiMo V2.5 من أرخص المزودين السحابيين المتاحين. الأفضل لـ: سير العمل الوكيلي الاقتصادي، المهام متعددة اللغات، سلاسل أدوات متعددة الخطوات، الأتمتة عالية الحجم.

الحصول على مفتاح API

  1. اذهب إلى platform.xiaomimimo.com
  2. سجّل حسابًا أو سجّل الدخول
  3. انتقل إلى API Keys وأنشئ مفتاحًا جديدًا
  4. الصقه في وولف فيش ← الإعدادات ← النماذج ← Xiaomi Mimo

النماذج

النموذجالسياقالإخراج الأقصىالأوضاعإدخال / إخراج (لكل مليون رمز)ملاحظات
mimo-v2.5-pro1M64Kبدون، عالي0.20/0.20 / 2.00أفضل نموذج MiMo. استدلال قوي ومتعدد اللغات.
mimo-v2.51M32Kبدون، عالي0.08/0.08 / 0.80توازن جيد بين الجودة والتكلفة.
mimo-v2-flash256K16Kبدون، عالي0.01/0.01 / 0.30رخيص للغاية للمهام عالية الحجم.

Kimi (Moonshot AI)

POST https://api.moonshot.ai/v1/chat/completions
يستخدم تدفق SSE بتنسيق أدوات متوافق مع OpenAI. يدعم الرؤية ومحتوى الاستدلال. الأفضل لـ: سير العمل الوكيلي، المهام ذات السياق الطويل، أحمال العمل المكثفة بالاستدلال.

الحصول على مفتاح API

  1. اذهب إلى platform.moonshot.ai
  2. سجّل حسابًا أو سجّل الدخول
  3. انتقل إلى API Keys وأنشئ مفتاحًا جديدًا
  4. الصقه في وولف فيش ← الإعدادات ← النماذج ← Kimi

النماذج

النموذجالسياقالإخراج الأقصىالأوضاعإدخال / إخراج (لكل مليون رمز)ملاحظات
kimi-k2.6256K64Kبدون، عالي0.95/0.95 / 4.00الأحدث. رؤية + استدلال.
kimi-k2.5256K64Kبدون، عالي0.60/0.60 / 3.00رؤية + استدلال.
moonshot-v1-128k128K16K2.00/2.00 / 5.00سياق طويل.

MiniMax

POST https://api.minimaxi.chat/v1/chat/completions
يستخدم تدفق SSE بتنسيق أدوات متوافق مع OpenAI. يدعم محتوى الاستدلال. الأفضل لـ: أحمال العمل المكثفة بالاستدلال، توليد الأكواد، سير العمل الوكيلي. يبقى DeepSeek وMiMo أرخص وأكثر قدرة لمعظم أحمال العمل.

الحصول على مفتاح API

  1. اذهب إلى platform.minimaxi.chat
  2. سجّل حسابًا أو سجّل الدخول
  3. انتقل إلى API Keys وأنشئ مفتاحًا جديدًا
  4. الصقه في وولف فيش ← الإعدادات ← النماذج ← MiniMax

النماذج

النموذجالسياقالإخراج الأقصىالأوضاعإدخال / إخراج (لكل مليون رمز)ملاحظات
MiniMax-M31M64Kبدون، عالي0.30/0.30 / 1.20الأحدث. استدلال قوي.
MiniMax-M2.7200K32K0.30/0.30 / 1.20الجيل السابق.
MiniMax-M2.5200K32K0.30/0.30 / 1.20توازن بين الجودة والتكلفة.

Qwen (علي بابا كلاود)

POST https://dashscope-intl.aliyuncs.com/compatible-mode/v1/chat/completions
يستخدم تدفق SSE بتنسيق أدوات متوافق مع OpenAI. يدعم الرؤية ومحتوى الاستدلال. الأفضل لـ: سير العمل الوكيلي الاقتصادي، توليد الشفرة البرمجية، المهام متعددة اللغات.

الحصول على مفتاح API

  1. اذهب إلى qwencloud.com
  2. سجّل حسابًا أو سجّل الدخول
  3. انتقل إلى API Keys وأنشئ مفتاحًا جديدًا
  4. الصقه في وولف فيش ← الإعدادات ← النماذج ← Qwen

النماذج

النموذجالسياقالإخراج الأقصىالأوضاعإدخال / إخراج (لكل مليون رمز)ملاحظات
qwen3.7-max1M64Kبدون، عالي، أقصى2.50/2.50 / 7.50الرائد. استدلال حدودي.
qwen3.7-plus1M64Kبدون، عالي، أقصى0.40/0.40 / 1.60استدلال قوي بسعر متوسط.
qwen3.5-flash1M64Kبدون، عالي، أقصى0.06/0.06 / 0.24استدلال فائق الرخص.
qwen3-coder-plus131K32Kبدون، عالي، أقصى0.40/0.40 / 1.60مُحسّن للشفرة البرمجية.

Stepfun

POST https://api.stepfun.ai/v1/chat/completions
يستخدم تدفق SSE بتنسيق أدوات متوافق مع OpenAI. يدعم الرؤية ومحتوى الاستدلال. الأفضل لـ: المهام المكثفة بالاستدلال التي تتطلب تفكير النموذج دائمًا.

الحصول على مفتاح API

  1. اذهب إلى platform.stepfun.ai
  2. سجّل حسابًا أو سجّل الدخول
  3. انتقل إلى API Keys وأنشئ مفتاحًا جديدًا
  4. الصقه في وولف فيش ← الإعدادات ← النماذج ← Stepfun

النماذج

النموذجالسياقالإخراج الأقصىالأوضاعإدخال / إخراج (لكل مليون رمز)ملاحظات
step-3.7-flash128K32Kدائم0.83/0.83 / 6.94الأحدث. استدلال حدودي.
step-3.5-flash128K32Kدائم0.83/0.83 / 6.94استدلال سريع.

Z.ai (Zhipu GLM)

POST https://api.z.ai/api/paas/v4/chat/completions
تدفق SSE متوافق مع OpenAI مع استدعاء الأدوات — التنسيق نفسه المستخدم في Kimi. تفكير GLM ثنائي (مُفعّل/مُعطّل، دون مستويات جهد)، ويوفّر GLM-5.2 نافذة سياق بمليون رمز. الأفضل لـ: العمل الوكيلي الموفّر للتكلفة وسير العمل طويل السياق.

الحصول على مفتاح API

  1. اذهب إلى z.ai
  2. سجّل حسابًا أو سجّل الدخول
  3. افتح API Keys وأنشئ مفتاحًا جديدًا
  4. الصقه في وولف فيش ← الإعدادات ← النماذج ← Z.ai

النماذج

النموذجالسياقالإخراج الأقصىالأوضاعإدخال / إخراج (لكل مليون رمز)ملاحظات
glm-4.6200K64Kتفكير مُفعّل/مُعطّل0.60/0.60 / 2.20موصى به. حصان عمل موفّر.
glm-4.5-air128K64Kتفكير مُفعّل/مُعطّل0.20/0.20 / 1.10الأرخص.
glm-5.21M64Kتفكير مُفعّل/مُعطّل1.40/1.40 / 4.40الرائد. أكبر سياق.
للاطلاع على تشكيلة GLM الكاملة وتفاصيل كل نموذج، راجع صفحة Z.ai.

Anthropic (Claude)

POST https://api.anthropic.com/v1/messages
يستخدم تدفق SSE. تصل استدعاءات الأدوات ككتل محتوى tool_use. الأفضل لـ: الاستدلال المعقد، واتباع التعليمات التفصيلية، والاستخدام الدقيق للأدوات، وcomputer-use (التفاعل مع الشاشة).

الحصول على مفتاح API

  1. اذهب إلى console.anthropic.com
  2. سجّل حسابًا أو سجّل الدخول
  3. انتقل إلى API Keys وأنشئ مفتاحًا جديدًا
  4. الصقه في وولف فيش ← الإعدادات ← النماذج ← Anthropic

النماذج

النموذجالسياقالإخراج الأقصىالأوضاعإدخال / إخراج (لكل مليون رمز)ملاحظات
claude-opus-4-81M32Kبدون، عالي، أقصى5.00/5.00 / 25.00الأحدث. استدلال حدودي.
claude-sonnet-4-61M64Kبدون، عالي، أقصى3.00/3.00 / 15.00أفضل توازن بين الجودة والتكلفة.
claude-haiku-4-5200K8Kبدون، عالي1.00/1.00 / 5.00سريع ورخيص. غير موصى به للمهام الوكيلية.
Anthropic هو المزوّد الوحيد الذي يدعم computer-use (التفاعل مع الشاشة). إن احتجت أن يقود وولف فيش متصفحًا أو واجهة سطح مكتب، تحتاج مفتاح Anthropic.

xAI (Grok)

POST https://api.x.ai/v1/chat/completions
يستخدم تدفق SSE بتنسيق أدوات متوافق مع OpenAI. يدعم الرؤية ومحتوى الاستدلال. الأفضل لـ: سير العمل المكثف بالاستدلال، توليد الشفرة البرمجية، مهام الرؤية.

الحصول على مفتاح API

  1. اذهب إلى console.x.ai
  2. سجّل حسابًا أو سجّل الدخول
  3. انتقل إلى API Keys وأنشئ مفتاحًا جديدًا
  4. الصقه في وولف فيش ← الإعدادات ← النماذج ← xAI

النماذج

النموذجالسياقالإخراج الأقصىالأوضاعإدخال / إخراج (لكل مليون رمز)ملاحظات
grok-4.31M64Kبدون، عالي، أقصى1.25/1.25 / 2.50الرائد. رؤية + استدلال.
grok-build-0.1256K32Kبدون، عالي، أقصى1.00/1.00 / 2.00مُحسّن للشفرة البرمجية.
grok-3-mini131K32Kبدون، عالي0.30/0.30 / 0.50سريع ورخيص.

OpenAI (GPT)

POST https://api.openai.com/v1/chat/completions
يستخدم تدفق SSE. تصل استدعاءات الأدوات ككائنات function_call. الأفضل لـ: المهام العامة، والمعرفة الواسعة، والردود السريعة.

الحصول على مفتاح API

  1. اذهب إلى platform.openai.com
  2. سجّل حسابًا أو سجّل الدخول
  3. انتقل إلى API Keys وأنشئ مفتاحًا جديدًا
  4. الصقه في وولف فيش ← الإعدادات ← النماذج ← OpenAI

النماذج

النموذجالسياقالإخراج الأقصىالأوضاعإدخال / إخراج (لكل مليون رمز)ملاحظات
gpt-5.51M64Kبدون، عالي، أقصى5.00/5.00 / 30.00الرائد. استدلال قوي.
gpt-5.4-mini1M64Kبدون، عالي، أقصى0.75/0.75 / 4.50استدلال سريع.
gpt-5.4-nano1M64Kبدون، عالي، أقصى0.20/0.20 / 1.25استدلال فائق الرخص.

OpenRouter (مُجمّع)

POST https://openrouter.ai/api/v1/chat/completions
يستخدم تدفق SSE بتنسيق أدوات متوافق مع OpenAI. يوجّه الطلبات إلى أي نموذج من أي مزوّد عبر مفتاح API واحد. OpenRouter هو مُجمّع نماذج — نقطة نهاية API واحدة تُوكّل الطلبات إلى Anthropic وOpenAI وDeepSeek وQwen وxAI وMeta وMistral وGoogle وعشرات غيرهم. مفتاح واحد، فاتورة واحدة، وصول لكل شيء.
نوصي بضبط المزودين مباشرة كلما أمكن. التكامل المباشر يمنحك زمن استجابة أقل (بدون قفزة وسيطة)، وتتبع تكاليف دقيق، وميزات خاصة بالمزوّد (التخزين المؤقت العابر في Anthropic، وFIM في DeepSeek)، وبدون هامش وسيط. يضيف OpenRouter طبقة توجيه قد تزيد زمن الاستجابة وتسبب سلوكًا غير متسق أحيانًا.استخدم OpenRouter عندما تريد تجربة نماذج لم تُعدّها مباشرة، أو كبديل مناسب لمزودين لا تريد إدارة مفتاح API منفصل لهم.

الحصول على مفتاح API

  1. اذهب إلى openrouter.ai
  2. سجّل حسابًا أو سجّل الدخول
  3. انتقل إلى Keys وأنشئ مفتاحًا جديدًا
  4. الصقه في وولف فيش ← الإعدادات ← النماذج ← OpenRouter

النماذج المدعومة

يدعم OpenRouter مئات النماذج. يُطابق وولف فيش حدود الإخراج مع حدود كل مزوّد أصلي:
النموذج (عبر OpenRouter)الإخراج الأقصىملاحظات
anthropic/claude-*32Kيطابق حدود Anthropic الأصلية.
openai/gpt-5*64Kيطابق حدود OpenAI الأصلية.
openai/o3، openai/o464Kنماذج استدلال.
deepseek/*32Kيطابق حدود DeepSeek الأصلية.
x-ai/grok-*32Kيطابق حدود xAI الأصلية.
google/gemini-*64Kنماذج Google Gemini.
meta-llama/*16Kنماذج Meta Llama.
qwen/*32Kيطابق حدود Qwen الأصلية.
mistralai/*32Kنماذج Mistral.
إذا كنت تستخدم بالفعل DeepSeek أو Anthropic أو أي مزوّد مدعوم أصليًا، أبقِ على الاتصال المباشر. أضف OpenRouter فقط لنماذج لا يمكنك الوصول إليها مباشرة. تدرج وولف فيش يتعامل مع الانتقال تلقائيًا — المزودون المباشرون يُجرَّبون أولًا.

Ollama (محلي)

POST http://localhost:11434/api/chat
يستخدم تدفق NDJSON. تصل استدعاءات الأدوات كـ JSON مُهيكَل في الاستجابة. لا حاجة لمفتاح API — يعمل بالكامل على جهازك. راجع دليل تكامل Ollama لمتطلبات النماذج وتوصيات العتاد. الأفضل لـ: الخصوصية، والاستخدام دون اتصال، والتجريب بلا تكلفة، والبديل المتوفر دائمًا.

تتبع الصحة

يتتبع thalamus صحة كل مزود بشكل مستقل:
  • عدد الإخفاقات — يزيد عند كل طلب فاشل
  • فترة التهدئة — تراجع أسّي بعد الإخفاقات
  • فحص الاتصالnet.isOnline() للكشف الفوري عن وضع عدم الاتصال
عندما يفشل مزود، يدخل فترة تهدئة قبل أن تُعاد محاولته. يتخطى التدرج المزودين غير الأصحاء وينتقل مباشرة إلى التالي المتاح.

اختيار مزود أساسي

اضبط مزودك الأساسي في الإعدادات أو في config.json. يتدرج بهذا الترتيب: DeepSeek → MiMo → Kimi → MiniMax → xAI → Qwen → Stepfun → Claude → OpenAI → OpenRouter → Ollama (يتخطى غير المُعدّين). تُجرَّب مزودك الأساسي أولًا، ثم يتولى التدرج عند الفشل. جميع المزودين اختياريون — تحتاج واحدًا مُعدًّا على الأقل. إن استخدمت مزودي السحابة فقط، يتخطى التدرج Ollama. إن استخدمت Ollama فقط، يكون هو المزوّد الوحيد.
للحصول على أفضل تجربة، أبقِ Ollama يعمل مع نموذج مُنزَّل كشبكة أمان. حتى لو كنت تستخدم Claude في المقام الأول، فإن وجود بديل محلي يعني أنك لن تعلق أبدًا بلا رد عند انقطاع الاتصال.