في غضون أيام، تجربة مشتركة بين أنثروبيك وموزيلا لقد قلبت هذه الطريقة التقليدية لاكتشاف الأخطاء في مشاريع البرمجيات الكبيرة رأساً على عقب. باستخدام هذا النموذج كلود أوبس 4.6تمكنت شركة الذكاء الاصطناعي من تحديد الموقع 22 ثغرة أمنية في متصفح فايرفوكس خلال أسبوعين فقط، وهو متصفح يستخدمه ملايين الأشخاص يوميًا في أوروبا وإسبانيا ويعتبر أحد المعايير المرجعية للمصادر المفتوحة.
وبعيداً عن كونها مجرد حكاية عابرة، تُظهر هذه الحالة مدى تأثير يمكن أن يصبح الذكاء الاصطناعي أداة لتدقيق الأمن ذات تأثير حقيقي: من بين تلك الثغرات الأمنية الـ 22، صنّفت موزيلا 14 حالة على أنها ذات خطورة عالية وقد تم تصحيحها بالفعل في فايرفوكس 148، وهي النسخة التي يتم توزيعها حاليًا على المستخدمين في الاتحاد الأوروبي وبقية أنحاء العالم.
الذكاء الاصطناعي كمدقق أمني: ما الذي تغير مع Claude Opus 4.6

كما أوضحت المنظمتان بالتفصيل، أُجريت الاختبارات على مدار أسبوعين تقريباً من العمل المكثف، حيث كرّس كلود نفسه لمراجعة أجزاء مختلفة من كود فايرفوكس. المتصفح، الذي يديره موزيلا وبفضل وجودها القوي في الدول الأوروبية المهتمة بالخصوصية والمعايير المفتوحة، تم اختيارها تحديداً لأنها تعتبر يُعدّ هذا المشروع من أكثر مشاريع المصادر المفتوحة تحليلاً وقوةً في النظام البيئي..
واجه نموذج أنثروبيك تحديًا يقع عادةً على عاتق فرق النخبة البشرية: المراجعة آلاف ملفات التعليمات البرمجية، بما في ذلك ما يقرب من 6.000 ملف C++بحثًا عن سلوكيات شاذة. وكانت النتيجة مجموعة من تم إرسال 112 تقريرًا فريدًا إلى نظام تتبع الأخطاء الخاص بموزيلا، بما في ذلك العيوب الـ 22 التي تم تسجيلها في النهاية على أنها ثغرات أمنية مع معرف CVE المقابل لها.
ولوضع هذه الأرقام في سياقها الصحيح، أشار مهندسو موزيلا إلى أن قاموا خلال عام 2025 بتصحيح 73 ثغرة أمنية خطيرة أو حرجةبمعنى آخر، في غضون أسبوعين ساعد كلود في اكتشاف ما يقرب من خُمس العيوب الخطيرة التي تظهر عادةً في عام كامل.وهذا يعطي فكرة واضحة عن القفزة النوعية في السرعة التي يمكن أن يجلبها الذكاء الاصطناعي إلى مجال الأمن السيبراني.
بالإضافة إلى المشكلات الأمنية، حدد نظام أنثروبيك ما يقرب من 90 خطأ إضافي أقل تأثيراًتضمنت هذه الأخطاء أخطاءً منطقية أو أخطاء في التأكيدات أثرت على استقرار المتصفح وتجربة المستخدم. ورغم أنها ليست بالغة الأهمية، إلا أن هذه النتائج ساهمت أيضاً في تحسين الأداء العام لمتصفح فايرفوكس.
كان أحد مفاتيح النجاح هو الطريقة التي تم بها التعامل مع البيانات: بدأ مشروع Anthropic بمحاولة إعادة إنتاج ثغرات Firefox التاريخية. لاختبار ما إذا كان كلود قادرًا على التعرف على أنماط الإخفاقات الموثقة في العالم الحقيقي. ومن ثم، انتقل الفريق إلى الجزء الأكثر إثارة للاهتمام: مطالبته بالعثور على أخطاء جديدة في الإصدار الحالي من المتصفحوهو أمر لم يتم الإبلاغ عنه من قبل.
كيف عثر كلود على أول ثغرة أمنية في غضون 20 دقيقة فقط

بداية التجربة تركت أكثر من شخص واحد في الفرق التقنية عاجزاً عن الكلام. بعد عشرين دقيقة فقط من بدء تحليل محرك جافا سكريبت لمتصفح فايرفوكسأشار برنامج Claude Opus 4.6 إلى ما بدا أنه ثغرة أمنية خطيرة. وبعد إجراء الفحوصات اللازمة، أكد الباحثون أنها بالفعل كذلك. خطأ من نوع الاستخدام بعد التحرير، وهو نوع من أنواع أخطاء الذاكرة التي، إذا تم استغلالها بشكل صحيح، يمكن أن تسمح للمهاجم بحقن التعليمات البرمجية الضارة أو إتلاف بيانات المتصفح الداخلية.
وللتحقق من هذه النتيجة، أجرى متخصصون في علم الإنسان اختبار الحالة على جهاز افتراضي مزود بأحدث إصدار من متصفح فايرفوكسبعد إعادة إنتاج السلوك الشاذ، تم توثيق المشكلة بعناية وإحالتها إلى Bugzilla، نظام تتبع الأخطاء الرسمي لموزيلابالإضافة إلى اقتراح تصحيح تم إنشاؤه بواسطة النموذج نفسه ومراجعته من قبل مهندسين بشريين.
الأمر الأكثر إثارة للدهشة هو أنه بينما كانت تفاصيل هذا التقرير الأول قيد الإعداد النهائي، كان كلود قد رصد بالفعل حوالي خمسين مدخلاً إضافياً ذات سلوك مشبوه.إن هذا الكم الهائل من النتائج في مثل هذا الوقت القصير سيكون من المستحيل تحقيقه عمليًا لفريق بشري يعمل بمفرده، وهو ما يفسر سبب جذب هذا التعاون الكثير من الاهتمام في مجتمع الأمن.
من جانب موزيلا، أشار مسؤولو الأمن إلى أن وصلت التقارير مصحوبة بحالات اختبار قليلة ومعزولة بشكل صحيح.بمعنى آخر، أجزاء صغيرة جدًا من التعليمات البرمجية تسمح بتفعيل الخلل مباشرةً. هذه الطريقة في العمل تقلل بشكل جذري الوقت الذي يحتاجه المهندسون للتحقق من كل خلل، وهي مرحلة غالبًا ما تتعثر عندما تكون التقارير غير دقيقة أو يصعب إعادة إنتاجها.
ومع مرور الأيام، اتسع نطاق التحليل من محرك جافا سكريبت إلى أجزاء أخرى من قاعدة بيانات المتصفحباتباع الاستراتيجية نفسها: تحديد الأنماط التي يُحتمل أن تكون خطيرة، وإنشاء حالة اختبار محددة، والتحقق مما إذا كان هناك تأثير أمني فعلي. من بين أكثر من مائة مشكلة حددها كلود، وقد أكدت موزيلا في النهاية وجود 22 ثغرة أمنية، 14 منها ذات خطورة عالية.والتي تم جمعها كثغرات أمنية في قاعدة بياناتهم العامة.
ردّ موزيلا: وضع الاستجابة للحوادث والتحديثات في فايرفوكس 148

بعد استلام مجموعة التقارير من شركة أنثروبيك، قامت موزيلا بتفعيل بروتوكول الاستجابة للحوادث لتصنيف الأخطاء وتصحيحها بأسرع وقت ممكن. بدأ فريقا الأمن والتطوير عملية فرز لفصلها ثغرات أمنية بالغة الخطورة، ومشاكل متوسطة، وأخطاء طفيفةمع مراعاة التأثير المحتمل على مئات الملايين من المستخدمين في أوروبا وبقية أنحاء العالم.
أكد مهندسو المؤسسة أن لقد أحدثت الجودة الفنية للتقارير فرقاً كبيراًكل ثغرة أمنية كانت مصحوبة بإثبات واضح للمفهوم، ووثائق مفصلة، وفي كثير من الحالات، حتى بـ الرقع المرشحة التي تم إنشاؤها بواسطة الذكاء الاصطناعي نفسهوقد سمح ذلك بإعداد جزء كبير من الإصلاحات في غضون أيام ودمجها في دورة الإصدار في الوقت المحدد. فايرفوكس 148.0، نُشر في نهاية شهر فبراير.
الثغرات الأمنية المتأثرة مكونات داخلية مختلفة للمتصفحبدءًا من إدارة الذاكرة وحدود الوصول وصولًا إلى ضوابط الأمان الداخلية، عززت موزيلا مستويات الحماية المتعددة للمستخدمين عند زيارتهم مواقع ويب قد تكون ضارة أو تحميلهم محتوى من جهات خارجية. ويكتسب هذا الأمر أهمية خاصة في الاتحاد الأوروبي، حيث تزداد صرامة لوائح حماية البيانات والأمن السيبراني.
أكدت المنظمة أن تم إصلاح جميع الثغرات الأمنية التي اكتشفها كلود في فايرفوكس 148وسيتم تصحيح الأخطاء الطفيفة المتبقية في الإصدارات اللاحقة. بالنسبة للمستخدمين، هذا يعني أن كل ما عليكم فعله هو حافظ على تحديث متصفحك للاستفادة من التحسينات التي تم إدخالها نتيجة لهذا التعاون.
وبعيداً عن الأرقام، أكدت موزيلا أن القضية ساهمت أيضاً في تعديل الإجراءات الداخلية: سيصبح دمج التحليلات المدعومة بالذكاء الاصطناعي جزءًا من استراتيجيتهم الأمنيةدائماً تحت إشراف بشري وضمن عمليات الكشف عن الثغرات الأمنية المسؤولة.
هل يستطيع الذكاء الاصطناعي ليس فقط اكتشاف الثغرات الأمنية، بل استغلالها أيضاً؟
بعد تجاوز مرحلة الكشف، أرادت شركة أنثروبيك معرفة إلى أي مدى يمكن أن تصل نماذج الذكاء الاصطناعي في مهام الأمن السيبراني الهجومية؟بمعنى آخر: إذا كان كلود قادراً على تحديد نقاط الضعف، فهل يمكنه أيضاً تحويلها إلى ثغرات استغلالية فعالة تحاكي سلوك المهاجم الحقيقي؟
للإجابة على هذا السؤال، أخذ الفريق العديد من الثغرات الأمنية التي سبق التحقق منها من قبل موزيلا وطلب من النموذج تطويرها اختبارات استغلال الثغرات الأمنية القادرة على قراءة وكتابة الملفات المحلية في نظام موضوعي، يُعد هذا إجراءً نموذجياً للالتزام الناجح. لم تكن التجربة رخيصة: تم تنفيذ عدة مئات من عمليات التنفيذ، وتم إنفاق ما يقرب من 4.000 دولار على أرصدة واجهة برمجة التطبيقات (API)..
إلا أن النتائج خففت من الحماس الأولي. فعلى الرغم من أن كلود أظهر براعة في فهم سياق نقاط الضعف، لم ينجح البرنامج في توليد ثغرات فعّالة إلا في حالتين محددتين.وحتى في تلك الحالة، كان ذلك يتم في ظل ظروف شديدة التحكم. الهجمات لم تكن تعمل إلا في بيئات الاختبار مع تعطيل إجراءات الأمان.، مثل صندوق الحماية وطبقات الحماية الأخرى التي يستخدمها متصفح فايرفوكس في عمليات التثبيت الواقعية.
ذكّرت موزيلا الجميع بأن يتطلب اختراق متصفح حديث عادةً ربط عدة ثغرات أمنية معًا. وتجاوز مختلف الحواجز الأمنية. إن تحديد ثغرة معينة، حتى لو كانت بالغة الخطورة، لا يكفي وحده للسيطرة على النظام. هذه النقطة مهمة بشكل خاص لمن يخشون أن يحوّل الذكاء الاصطناعي أي ثغرة تلقائيًا إلى هجوم جاهز للاستخدام.
أما شركة أنثروبيك، من جانبها، فقد اتخذت موقفاً حذراً: من الواضح أن الذكاء الاصطناعي الحالي أفضل في اكتشاف الأخطاء من استغلالها.ولا تزال تكلفة تطوير استغلال فعال للثغرات الأمنية أعلى بكثير من تكلفة اكتشافها. ومع ذلك، أقرت الشركة بأن مجرد تمكن النموذج من إنشاء استغلالات بسيطة يُعدّ مدعاةً للقلق، وأنه من المستحسن توقع الاستخدامات الخبيثة المحتملة من خلال تعزيز الدفاعات في أسرع وقت ممكن.
دور المصادر المفتوحة وتأثيرها في أوروبا
توضح حالة فايرفوكس جيداً كيف يلعب البرمجيات مفتوحة المصدر دورًا حاسمًا في البنية التحتية الرقمية يستخدمها المواطنون الأوروبيون. لا تقتصر متصفحات مثل فايرفوكس على السماح بالوصول إلى الإنترنت فحسب، بل تعمل أيضًا كمنصة للخدمات العامة عبر الإنترنت، والخدمات المصرفية، والحكومة الإلكترونية، وأدوات الأعمال التي تعمل بموجب أطر تنظيمية للاتحاد الأوروبي مثل لائحة الأمن السيبراني أو اللائحة العامة لحماية البيانات.
أن نموذج الذكاء الاصطناعي قد تمكن من اكتشاف عيوب كبيرة في مشروع تم فحصه بدقة يُظهر هذا أن هناك دائمًا ثغرات يجب سدّها، حتى عندما يبدو أن "آلاف العيون تراقبنا". بالنسبة للعديد من مجتمعات البرمجيات الحرة، بما في ذلك تلك الموجودة في إسبانيا ودول أوروبية أخرى، فإن إمكانية دمج أدوات مثل كلود قد تعني زيادة كبيرة في الكشف المبكر عن الأخطاءوخاصة في المشاريع ذات الموارد المحدودة.
لكن الأمر لا يقتصر على المزايا التلقائية فقط. ففي السنوات الأخيرة، اشتكت العديد من مشاريع المصادر المفتوحة من موجات من التقارير التي تم إنشاؤها بواسطة الذكاء الاصطناعي بنسبة عالية من النتائج الإيجابية الخاطئةوهي عمليات تستغرق وقتًا طويلاً ولا تضيف قيمة حقيقية. يكمن الاختلاف في عمل أنثروبيك في المنهجية: فقد أعطوا الأولوية لإرسال تقارير مبررة جيداً، مع الحد الأدنى من حالات الاختبار والتصحيحات المرشحة.بدلاً من إغراق موزيلا بتنبيهات عامة.
يتماشى هذا النهج مع الطريقة التي يحاول بها الاتحاد الأوروبي تنظيم الذكاء الاصطناعي: الترويج للاستخدامات التي توفر فوائد واضحة —مثل تحسين أمن البنية التحتية الحيوية— مع مراقبة الاستخدام المحتمل لهذه الأدوات في أنشطة هجومية أو مسيئة. ورغم أن التعاون كان عالميًا، فقد استفاد مستخدمو فايرفوكس الأوروبيون بشكل مباشر من طرح هذه التحديثات في الإصدار 148 من المتصفح.
وفي الوقت نفسه، أشارت شركة أنثروبيك إلى أن يرغب في مواصلة العمل على المشاريع ذات الصلة ضمن بيئة المصادر المفتوحةبما في ذلك مكونات أساسية مثل نواة لينكس. بالنسبة لقطاع التكنولوجيا الأوروبي، حيث تعتمد العديد من الشركات والإدارات العامة على حلول مفتوحة المصدر، يفتح هذا المجال الباب أمام عمليات تدقيق أمني أعمق وأقل تكلفة مما كان ممكناً في السابق.
ما الذي يستنتجه فريقا المنتج والأمن من كل هذا؟
إن ما حدث مع فايرفوكس لا يقتصر على كونه ذا أهمية لعمالقة التكنولوجيا أو توزيعات لينكس الرئيسية فحسب، بل يقدم أيضاً العديد من الدروس العملية لـ فرق التطوير في إسبانيا وأوروبا التي تقوم ببناء خدمات رقمية أو تطبيقات ويب أو حلول SaaS ذات نطاق واسع.
الأولى واضحة تماماً: انخفضت تكلفة التدقيق الأولي بمساعدة الذكاء الاصطناعي بشكل كبير.ما كان يتطلب سابقًا أسابيع من العمل من قبل فريق من المتخصصين، أصبح الآن بالإمكان إجراء مسح آلي أولي بتكلفة زهيدة، شريطة أن يُستكمل بمراجعة بشرية. في المشاريع التي تستعد للحصول على شهادات السلامة أو للامتثال للوائح الأوروبية، يُمكن أن يُحدث هذا فرقًا كبيرًا.
أما الأمر الثاني فيتعلق بالعمليات الداخلية: بدأت سرعة الكشف تتجاوز قدرة الإنسان على التصحيح.إذا كانت أداة مثل كلود قادرة على إنشاء عشرات التقارير في غضون أيام قليلة، فإن المفتاح لم يعد يكمن في العثور على الأخطاء، بل في وجود آليات مرنة لتحديد أولوياتها وتصحيحها دون إعاقة تطوير المنتج.
ثالثًا، تُظهر التجربة مع موزيلا أن لا يكفي ربط الذكاء الاصطناعي بالمستودع وقبول جميع تعديلاته.من الضروري وجود ما يُطلق عليه أنثروبيك "مُدقِّقات المهام": اختبارات آلية تُؤكِّد إزالة الثغرة الأمنية وأن التغيير لا يُؤثِّر سلبًا على أجزاء أخرى من النظام. وبدون هذه الطبقة، يزداد خطر حدوث تراجعات في الأداء بشكل كبير.
وأخيرًا، من المهم ألا نغفل البعد الهجومي. مع ذلك، وكما هو الحال اليوم تتفوق نماذج الذكاء الاصطناعي في اكتشاف الأخطاء على استغلالها.قد تتقلص هذه الفجوة في السنوات القادمة. بالنسبة للشركات الأوروبية والإدارات العامة، فإن استباق هذا السيناريو يعني دمج هذه الأدوات في دفاعاتها قبل أن يتمكن المهاجمون الأقل نزاهة من السيطرة.
بشكل عام، التعاون بين أنثروبيك وموزيلا مع كلود أوبوس 4.6 كبطل رئيسي يرسم هذا صورةً حيث يرسخ الذكاء الاصطناعي نفسه كنوع جديد من مدققي الأمن: قادر على مراجعة ما كان يستغرق شهورًا في السابق في غضون أيام، وعلى إيجاد ثغرات خطيرة في مشاريع راسخة مثل فايرفوكس، وعلى دفع فرق التطوير - أيضًا في إسبانيا وبقية أوروبا - إلى تحديث عملياتها الخاصة بالحماية والاستجابة للإخفاقات الحرجة.
