يطلق الأنثروبور أول نموذج للمنطق “هوبريد”.

الفرق بين النموذج التقليدي والمنطق يشبه نوعين من التفكير الموصوف من قبل الاقتصادي الحائز على جائزة نوبل مايكل كهينمان في الكتاب 2011 التفكير بسرعة وبطيئة: تفكير النظام السريع والغريزي. وأبطأ أكثر تفكير نظام التداول 2.

هذا النوع من النموذج الذي جعل chatgpt ممكنا ، والمعروف باسم LLM ، ينتج استجابات فورية لمطالبة من خلال الاستعلام عن شبكة عصبية كبيرة. يمكن أن تكون هذه المخرجات ذكية ومتماسكة بشكل لافت ولكنها قد تفشل في الإجابة على الأسئلة التي تتطلب التفكير خطوة بخطوة ، بما في ذلك الحساب البسيط.

يمكن إجبار LLM على تقليد التفكير التداولي إذا تم توجيه تعليمات إلى التوصل إلى خطة يجب أن تتبعها بعد ذلك. هذه الخدعة ليست موثوقة دائمًا ، ومع ذلك ، فإن النماذج تكافح عادةً لحل المشكلات التي تتطلب تخطيطًا دقيقًا على نطاق واسع. تستخدم Openai و Google والآن الآن طريقة تعلم آلي تُعرف باسم التعلم التعزيز للحصول على أحدث نماذجها لتعلم توليد التفكير الذي يشير إلى الإجابات الصحيحة. هذا يتطلب جمع بيانات تدريب إضافية من البشر على حل مشاكل محددة.

يقول Penn أن وضع التفكير في كلود تلقى بيانات إضافية حول تطبيقات الأعمال بما في ذلك كتابة كود الكتابة وتحديدها ، وذلك باستخدام أجهزة الكمبيوتر ، والإجابة على الأسئلة القانونية المعقدة. – الأشياء التي قمنا بإجراء تحسينات عليها […] الموضوعات الفنية أو الموضوعات التي تتطلب التفكير الطويل ، كما يقول بن. “ما لدينا من عملائنا هو الكثير من الاهتمام في نشر نماذجنا في أعباء العمل الفعلية الخاصة بهم.

تقول الأنثروبور إن كلود 3.7 جيد بشكل خاص في حل مشكلات الترميز التي تتطلب التفكير خطوة بخطوة ، مما يتفوق على Openai O1 على بعض المعايير مثل Swe-Bench. تقوم الشركة اليوم بإصدار أداة جديدة ، تسمى Claude Code ، المصممة خصيصًا لهذا النوع من الترميز بمساعدة AI.

يقول بن: “النموذج جيد بالفعل في الترميز”. â € œ[But] سيكون التفكير الإضافي مفيدًا للحالات التي قد تتطلب تخطيطًا معقدًا للغاية – قل أنك تبحث عن قاعدة رمز كبيرة للغاية لشركة ما.