أعلنت شركة ميتا عن إطلاق مشروعها الجديد “NotebookLlama”، وهو منصة مفتوحة المصدر تهدف إلى إنشاء حلقات بودكاست تفاعلية تعتمد على الذكاء الاصطناعي. يأتي هذا المشروع في إطار منافسة مباشرة مع منصة غوغل “NotebookLM”، التي حققت شهرة كبيرة مؤخرًا.
يعتمد “NotebookLlama” على نماذج الذكاء الاصطناعي المعروفة باسم “Llama”، والتي تساهم في إجراء معالجة النصوص بشكل أساسي. مثل “NotebookLM”، يمكن لهذه الأداة إنتاج ملخصات صوتية بأسلوب حواري استنادًا إلى النصوص المرفوعة.
تبدأ عملية “NotebookLlama” بتحويل النصوص، سواء كانت مقالات إخبارية أو منشورات، إلى ملفات صوتية، ثم تضيف عناصر درامية وتفاعلات تعزز من حيوية المحتوى قبل تحويله إلى صوت باستخدام نماذج مفتوحة. ومع ذلك، تظهر النتائج الحالية أن جودة الصوت لا تضاهي تلك التي تقدمها أداة “NotebookLM”، حيث تبدو الأصوات في عينات “NotebookLlama” آلية وتفتقر إلى الطبيعة السلسة، مع تداخل غير منسق في الحوار.
يأمل الباحثون في ميتا في تحسين جودة الصوت عبر استخدام نماذج أقوى، مؤكدين أن “نموذج تحويل النص إلى كلام هو العامل الرئيسي في تحقيق الصوت الطبيعي”. كما يشيرون إلى إمكانية استخدام نهج مختلف يتضمن تفاعل اثنين من وكلاء الذكاء الاصطناعي لمناقشة الموضوع وبناء الحوار، بدلاً من الاعتماد على نموذج واحد فقط.
الجدير بالذكر أن “NotebookLlama” ليست المحاولة الأولى لاستنساخ ميزة البودكاست من “NotebookLM”، فقد ظهرت عدة مشاريع في هذا السياق، لكنها واجهت تحديات متشابهة، بما في ذلك مشكلة “الهلوسة” التي تعاني منها معظم تطبيقات الذكاء الاصطناعي، بما في ذلك “NotebookLM”، حيث قد تنتج معلومات غير دقيقة أو مختلَقة في المحتوى الصوتي.