المُلخص:
- يؤكد ستيف هسو، المؤسس المشارك لشركة SuperFocus الناشئة في مجال الذكاء الاصطناعي، أن DeepSeek شركة مبهرة.
- يختبر فريقه كيفية عمل نماذج DeepSeek مع نظام SuperFocus، ويخطط للتحول إليها.
- يجد هسو أن نماذج DeepSeek أرخص وأسرع وأكثر خصوصية.
هذه المقالة مبنية على محادثة مع ستيف هسو، المؤسس المشارك لشركة SuperFocus الناشئة في مجال الذكاء الاصطناعي وأستاذ الفيزياء النظرية والرياضيات الحاسوبية والعلوم والهندسة في جامعة ولاية ميشيغان. تم تحرير ما يلي من أجل الإيجاز والوضوح.
في SuperFocus، نقوم بإنشاء ذكاء اصطناعي خارق للشركات. تشمل حالات الاستخدام النموذجية خدمة العملاء، وتلقي الطلبات، والتوصيل، وتحليل المستندات، وجدولة السفر. عند بناء أنظمة الذكاء الاصطناعي الخاصة بنا، فإن أحد المكونات التي نستخدمها عادةً هو نماذج لغوية ضخمة مثل GPT-4.
من خلال التحدث مع مؤسسي ومهندسي الذكاء الاصطناعي الآخرين، يبدو أن الجميع يجربون نماذج DeepSeek. إنها من بين أفضل النماذج مفتوحة المصدر المتاحة – إن لم تكن الأفضل – وهي أرخص بكثير من النماذج مغلقة المصدر، وسأكون مندهشًا جدًا إذا لم يكن هناك تحول كبير إلى نماذج مفتوحة المصدر في العام المقبل.
نجري حاليًا الكثير من الاختبارات على كيفية عمل نماذج DeepSeek-V3 مع نظامنا، لكننا واثقون جدًا بالفعل من أنها جيدة بما يكفي للقيام بما نحتاج إلى القيام به، وإذا كان العميل سيستفيد منها، فيمكننا إجراء التبديل.
إلى جانب عمل العملاء، لدينا أيضًا قسم خاص بالبحث والتطوير في الشركة، والذي يتضمن فاتورة شهرية كبيرة من OpenAI. لتوفير المال، نخطط لتحويل الكثير من الأنشطة إلى نماذج مفتوحة المصدر مثل DeepSeek.
روابط سريعة
ثلاثة أسباب رئيسية تدفعنا للتحول إلى DeepSeek
1. التكلفة
تتميز نماذج DeepSeek بانخفاض تكلفة تشغيلها بحوالي 30 مرة مقارنة بنماذج OpenAI المشابهة. وهذا يُترجم إلى وفورات كبيرة في التكاليف لقطاع خدمة العملاء. ففي حين أن التكلفة الإجمالية لموظف خدمة عملاء في الولايات المتحدة قد تصل إلى حوالي 25 دولارًا في الساعة، وتنخفض إلى ما بين 5 و10 دولارات في الساعة في الفلبين، فإن نماذجنا التي تستخدم OpenAI كمُزوّد للنماذج اللغوية الكبيرة تُمكّننا من خفض التكاليف إلى عُشر تكلفة توظيف إنسان يعمل في الفلبين.
مع استخدام DeepSeek-V3، يمكن أن تنخفض تكاليفنا بمقدار 30 مرة إضافية.
2. السرعة
لقد وجدنا أن نموذج المصدر المفتوح أسرع أيضًا. هذا مهم بالنسبة لنا لأن الكثير من عملنا يتضمن تفاعلات صوتية، ولا يحب البشر فترة زمنية طويلة بين توقفهم عن الكلام واستجابة النموذج. يبدو الأمر غير طبيعي ولا يشبه المحادثة.
عندما تُبدع بتقنيات جديدة، خاصة في مجال البرمجيات، ستحصل على سرعات قد تكون أسرع بـ 10 أو 100 مرة بسهولة نظرًا للتحسينات الأفضل واستخدام الخوارزميات.
نفذ فريق DeepSeek عددًا كبيرًا من التحسينات والابتكارات الذكية للغاية لتعديل بنية النموذج الفعلية، مما يعني أنه يمكنهم استخدام ذاكرة أقل ويحتاجون إلى طاقة حوسبة أقل بكثير لتوليد الرموز المميزة أو تدريب النماذج؛ لذلك، يكون النموذج أسرع في توليد الرموز المميزة بمجرد تلقيه مُدخل.
3. الخصوصية
يساور بعض العملاء القلق بشأن تدفق بياناتهم عبر نموذج OpenAI أو نموذج مملوك. على سبيل المثال، إذا كان لدينا عميل صندوق أسهم خاص، فقد يقوم الذكاء الاصطناعي بتحليل مستندات حساسة للغاية لا يريدون أن يطلع عليها أي شخص خارج الشركة.
نظرًا لأن DeepSeek مفتوح المصدر، يمكن لأي شخص تشغيل النموذج على أجهزته الخاصة، أو على خوادم مستأجرة من AWS أو أي موفر سحابي آخر. لا يمتلك النموذج نفسه قناة اتصال تعود إلى DeepSeek. لذلك، نحن قادرون على بناء منصة برمجيات الذكاء الاصطناعي بالكامل داخل مثيل السحابة حيث توجد بيانات العميل بالفعل، دون إرسال البيانات مطلقًا عبر واجهة برمجة التطبيقات الخاصة بـ Google AI أو OpenAI، على سبيل المثال.
لن يكون هذا هو الحال إذا كان مغلق المصدر، مثل بعض نماذج معالجة اللغات الطبيعية (LLMs) الأخرى التي صنعتها شركات صينية. في هذه الحالة، يجب عليك التواصل مع النموذج عبر واجهة برمجة التطبيقات الخاصة بهم، ويتم تشغيله على أجهزة تتحكم فيها الشركة الصينية، تمامًا كما هو الحال مع OpenAI.
يمكنني أن أتخيل عميلًا يقول: “لا نريد استخدام تلك النماذج الصينية الشيوعية. حتى إذا كان ذلك يكلف 10 أضعاف أو 30 ضعفًا، فأنا أفضل استخدام نموذج OpenAI أو Anthropic”. وإذا قال لنا أحدهم ذلك، فلا مشكلة. ولكن نظرًا لأن هدف شركتنا هو بناء نماذج ذكاء اصطناعي ضيقة تخدم أغراضًا محددة، فإن القضايا السياسية لا تثار بشكل عام.
أعتقد أن DeepSeek شركة مثيرة للإعجاب ومنفتحة للغاية
لقد كنتُ أتابع عمل العديد من الشركات الصينية التي تُطور نماذج اللغات الكبيرة (LLMs)، وكان فريقنا يختبر النماذج الصينية مفتوحة المصدر منذ عدة أشهر حتى الآن. أعتقد أن DeepSeek شركة مثيرة للإعجاب تُنتج أوراق بحثية رائعة حقًا؛ يمكنك أن ترى أنهم يحاولون أن يكونوا واضحين جدًا بشأن ما فعلوه ونتائجهم، ويشجعون الآخرين على إعادة تطبيق أو التحقق من صحة ما فعلوه.
مؤسس الشركة مثالي للغاية ولديه فلسفة، وقد تحدث عنها في المقابلات، مفادها أنه من خلال الانفتاح، سيتقدم المجال بشكل أسرع، وهو ما أعتقد أنه صحيح. إنهم أكثر انفتاحًا من أي مختبر كبير آخر في الولايات المتحدة، بما في ذلك OpenAI، حول ما يفعلونه – إنه لأمر مثير للسخرية.
مسار الذكاء الاصطناعي للمستقبل
فجأةً، أصبح الكثير من الأمريكيين على دراية بتقنيات صينية لم يكونوا يعرفون عنها شيئًا من قبل. لكن ثقتنا الأمريكية بأنفسنا عالية جدًا لدرجة أن الناس ينكرون حقيقة تقدم الصين في مجال الذكاء الاصطناعي ويتظاهرون بأننا ما زلنا متقدمين ولم تلحق بنا الصين بعد. حتى أن بعض الأشخاص على الإنترنت، بمن فيهم مؤسسو شركات بارزة في مجال التكنولوجيا، يرددون مزاعم سرقة الصين للمعلومات منا، مثل الادعاءات بأن شركة DeepSeek استخلصت نماذجها من نماذج OpenAI وأن تكلفة 5.5 مليون دولار لتشغيل تدريبها مزيفة. لا أعتقد أن هذه الاتهامات صحيحة.
يُعد سباق الذكاء الاصطناعي هذا منافسة حاسمة، سواء على الصعيد الاقتصادي أو على صعيد المكانة التكنولوجية. أعتقد أنها ستكون منافسة شرسة بين الولايات المتحدة والصين، وفي أي لحظة، قد تكون العديد من النماذج المتطورة نماذج صينية.
ستكون منافسة رائعة، وسيستفيد المستهلكون منها بانخفاض الأسعار. سيحصل الناس على المزيد من الاستدلال والذكاء التطبيقي بأسعار أقل في حياتهم اليومية. مع دفع المنافسة للأمور إلى الأمام وزيادة عدد العقول العاملة على هذه المشكلة، أعتقد أننا سنصل إلى الذكاء الاصطناعي العام (AGI) بشكل أسرع.
سيعود ذلك بالنفع على العلماء أيضًا. على سبيل المثال، سيتمكن أستاذ في معهد كاليفورنيا للتكنولوجيا من تنزيل نموذج تفكير مثل R1 والبدء في ضبطه لمساعدته في حل مشاكل البحث في الفيزياء أو الرياضيات. لم يكن هناك طريقة للقيام بذلك مع نماذج OpenAI. سيساهم توفر نماذج مفتوحة المصدر جيدة حقًا في إحداث طفرة من الابتكارات.