الأتمتة تفشل عند المفاصل — مخطّطٌ لإطلاق وكلاء الذكاء الاصطناعي بثقة

في تكليفٍ استشاريٍّ حديث، كان لدى عميلي — وهو مؤسسة كبيرة — استراتيجية بيانات مكتوبة. ومن أهداف هذه الاستراتيجية أولاً رفعُ جودة عناصر البيانات الحرجة (CDE) — بضعةُ آلافٍ من حقول البيانات موزّعة على عشرات الأنظمة التشغيلية التي تعتمد عليها نتائج الأعمال اعتماداً كبيراً.

الاستراتيجية سليمة، ومعتمدة من القيادة العليا. وكانوا قد ثبّتوا واختبروا مؤخّراً أداةً مدعومة بالذكاء الاصطناعي: فهرس بيانات مركزي (data catalog) مع تحليلٍ آليٍّ لبيانات التعريف (metadata) في الأنظمة المصدر، وقياساتٍ آليةٍ لجودة البيانات تُجرى يومياً مع إشارةٍ فوريةٍ إلى البيانات منخفضة الجودة. وهي ميزةٌ قياسيةٌ إلى حدٍّ كبير في فهارس البيانات الحديثة. حتى هنا، الأمور تسير على ما يُرام.

غير أنّ التنفيذ كان أصعب من الخطة. فقد اقتضى النهجُ تطبيقَ الأداة على موجات، بدءاً بأعلى ثلاثة مصادر بياناتٍ أولويةً. لكنّنا واجهنا هنا تحدّياتٍ، وهي أيضاً شائعةٌ إلى حدٍّ ما:

A) الملكية والوصول — أبطأت ملكيةُ البيانات وصلاحياتُ أمنائها الحصولَ على حقوق الوصول إلى الأنظمة
B) الدَّيْن التقني — ضعفُ مستوى توثيق الأنظمة، دون معالجة، لأنّ
C) فقدان المعرفة — كثيراً من موردي الأنظمة أو فرق التطوير الداخلية قد رحلوا وأخذوا معهم معرفةً ثمينة
D) فجوة الإشراف — والأهمّ من ذلك، أدوارُ إشرافٍ على البيانات غير مُفعَّلة أو متردّدة

ولذلك بدأ العملُ بالأنظمة «الأكثر جاهزيةً» بدلاً من تلك التي رتّبتها الاستراتيجية في القمّة — قرارٌ واقعي، لكنّه خطوةٌ مبتعدةٌ عن المقصد. أمّا البيانات التي بلغت الفهرس ومحرّك الجودة فقد جاءت بقواعد عملٍ مُلتقَطةٍ جزئياً فقط ودون إشرافٍ فاعلٍ خلفها، فلم تستطع الفحوصُ الآلية — بما فيها الذكاء الاصطناعي — أن تحقّق ما سعت إليه الاستراتيجية. لم يفشل شيءٌ بصخب. بل فشل في الفجوات بين الاستراتيجية والعملية والضوابط. فشل عند المفاصل.

لقد أمضيتُ مسيرةً مهنيةً كاملةً أرى أتمتة العمليات تموت عند تلك المفاصل — قبل وقتٍ طويلٍ من نشر أيّ وكيل ذكاءٍ اصطناعي، أو شراء اشتراكٍ في نموذج لغةٍ كبير (LLM).

ويجعل الوكيلُ المفاصلَ نفسها أشدَّ خطراً، لأنّ الوكيل لا يحمل البيانات فحسب — بل يفعل: يقرأ الأنظمة، ويتّخذ قراراً، ويُطلِق الخطوة التالية. خُذ ثلاثة أمثلة: مستوى المخاطرة الذي أعلنتَ قبولَه في عرضٍ استراتيجي، أو قاعدةٌ كتبتها في سياسة، أو موافقةٌ افترضتَ أنّ أحداً يملكها. فإن لم يَعبُر أيٌّ منها إلى ما يفعله النظام فعلاً، تصرّف الوكيلُ على أيّ حال — بسرعة الآلة، وعبر الفجوة مباشرةً. في مقالتي السابقة جادلتُ بأنّ الذكاء الاصطناعي الوكيل يحتاج نموذج تشغيل، لا نموذجاً فحسب. وهذه هي «الكيفية»: نموذج تشغيل الذكاء الاصطناعي في صفحةٍ واحدة — مخطّطٌ يُغلِق المفاصل لوكيلٍ واحد، في سير عملٍ واحدٍ في كلّ مرة.

الطبقات الثلاث — والمفصلان

تعيش نماذج التشغيل على ثلاث طبقات. الطبقة الاستراتيجية تقرّر هل ينبغي فعلُ ذلك أصلاً، ومن يملك القرار. والطبقة التشغيلية تترجم ذلك إلى كيفية سير العمل — الموافقات والاستثناءات والمقاييس التي تخبرك أنّه ينضبط. وطبقة الضوابط هي ما يفرضه النظام فعلياً. ومعظم الفرق تصبّ جهدها في الطبقة التي تراها — الضوابط — وتفترض أنّ الطبقتين الأخريين مُعالَجتان.

لكنّ الإخفاق نادراً ما يكون داخل طبقة. بل يكون في المفصلين بينها: حيث تُسلَّم النيّةُ الاستراتيجية إلى العملية، وحيث تُسلَّم العمليةُ إلى الضابط. يُحدَّد مستوى المخاطرة المقبول ولا شيء في الأسفل يفرضه. تُكتَب سياسةٌ ولا تتحوّل قطّ إلى سلوك. أغلِق المفاصل تصمد الأتمتة؛ اترُكها مفتوحةً تتسرّب — تماماً كما حدث في برنامج البيانات لديّ، عند المفصلين معاً.

المخطّط يُغلِق المفاصل

هذا المخطّط هو الرفيق العملي (how-to) لـإطار الجناحين للذكاء الاصطناعي (TWAF): فإطار الجناحين هو «ماذا» و«لماذا»؛ وهذا المخطّط جزءٌ من «كيف»، مُطبَّقاً على وكيلٍ واحدٍ في كلّ مرة.

أنت لا تحوكم «الذكاء الاصطناعي» في المطلق — بل تُسنِد إلى وكيلٍ واحدٍ مهمةً واحدةً ضمن سير عملٍ واحد، وتملأ تسع خاناتٍ تمتدّ عبر الطبقات الثلاث في صفحةٍ واحدة. املأها فتُجبَر النيّةُ المرسومةُ في القمّة على البقاء حتى ما يفعله النظام في الأسفل. وإن لم تستطع ملءَ خانةٍ بصدق، فقد وجدتَ ثغرتك — فالخانة الفارغة هي الاكتشاف بعينه.

الاستراتيجية — ما تنويه

1. مهمّة الوكيل — سير العمل الواحد والقرار أو الإجراء المحدّد الذي يملكه الوكيل.
2. مستوى الاستقلالية — كم يجوز له أن يفعل وحده (انظر السُّلّم أدناه)؛ ابدأ من أدنى درجةٍ مفيدة.
3. المسؤول البشري — شخصٌ واحدٌ مُسمّى يُجيب عن النتائج. مالكٌ واحد، لا توقيعٌ موزّعٌ على لجنة.

التشغيل — كيف يعمل

4. نقاط المراجعة البشرية — أين يوافق شخصٌ قبل الفعل، وأين يُكتفى بإبلاغه، وأين يكون الوكيل مستقلاً.
5. التصعيد والبديل الآمن — ماذا يفعل عند عدم اليقين أو الخروج عن الحدود: إلى من يُصعِّد، والبديل الآمن حين لا يتوفّر إنسان، ومفتاح الإيقاف.
6. مقياسان — مقياسُ قيمة (هل يؤتي ثماره؟) ومقياسُ ضبط (هل يبقى داخل الحدود؟). أحدهما دون الآخر سيخدعك.

الضوابط — ما يفرضه فعلياً (يُهيَّأ قبل تشغيل أيّ وكيل)

A. الحواجز الواقية كضوابط — كلّ سياسةٍ مكتوبةٍ كشيءٍ يفرضه النظام فعلاً (قائمة سماح، بوابة صلاحيات، خطوة تحقّق)، ومفروضةٍ خارج متناول الوكيل نفسه.
B. البيانات والوصول — المدخلات المحوكَمة التي يعتمد عليها والأنظمة المسموح له بلمسها.
C. مراقبة الانجراف — يراقب النظام استباقياً انجرافَ النموذج والبيانات — ويغذّي مقياسَ الضبط (6).

تقع المفاصلُ بين هذه المجموعات الثلاث. والضوابط ذاتُ الأحرف (A وB وC) بنيةٌ تحتيةٌ قائمة — تضعها مرّةً واحدةً قبل تشغيل أيّ وكيل؛ أمّا الخطوات المرقّمة (1–6) فهي ما تصمّمه لكلّ وكيلٍ جديد. والمخطّطُ هو المكان الذي تلتقي فيه الطبقاتُ الثلاث على سير عملٍ واحد، فلا يبقى للمفاصل مكانٌ تختبئ فيه.

كيف تبدو وقد امتلأت

المخطّطاتُ المجرّدة يسهل الإيماءُ لها ويصعب استعمالها، فإليك مثالاً بسيطاً — وكيلٌ يرمّز فواتير الموردين إلى مركز التكلفة الصحيح:

المهمّة — قراءةُ كلّ فاتورةٍ وإسنادُ مركز تكلفتها ورمزها المحاسبي (GL).
الاستقلالية — أوصِ: يقترح الترميز ويوافق عليه موظفٌ قبل أيّ ترحيل.
المسؤول البشري — رئيسُ فريق الحسابات الدائنة، بالاسم.
نقاط المراجعة — يوافق الموظفُ على كلّ فاتورةٍ تتجاوز مبلغاً محدّداً؛ وما دونه يوافق على دفعة اليوم.
التصعيد والبديل — المورّد غير المعروف أو الثقة المنخفضة يُحوَّل إلى الموظف؛ وإن لم يتوفّر أحدٌ تبقى الفاتورة في قائمة انتظارٍ بلا ترميزٍ بدلَ التخمين؛ ومفتاحُ إيقافٍ يوقف كلّ الترميز.
المقياسان — القيمة: نسبة الفواتير المُرمَّزة دون تعديلٍ بشري؛ والضبط: نسبة الإجراءات خارج قائمة السماح (الهدف: صفر).
الحواجز — يكتب فقط في حقل الترميز المسوّدة، ولا يرحّل إلى دفتر الأستاذ، وسجلّ الموردين للقراءة فقط — مفروضةً بصلاحياتٍ لا يستطيع تغييرها.
البيانات والوصول — سجلّ الموردين المعتمد ودليل الحسابات؛ دون وصولٍ إلى المدفوعات.

املأ هذه الأسطر التسعة فيتّخذ قرارُ النشر نفسَه بنفسه غالباً.

سُلّم الاستقلالية

الخانة 2 هي حيث تُفرِط معظمُ الفرق. هذا سُلّمٌ من الصلاحية الممنوحة — كم تسمح للوكيل أن يفعل — لا قياسٌ لمدى ذكاء النموذج؛ فنموذجٌ بالغُ القدرة على الدرجة الدنيا أمرٌ سليمٌ وشائع. وحقوقُ القرار ليست تشغيلاً/إيقافاً:

اسأل — يقترح الوكيلُ أو يصوغ؛ ويقرّر الإنسانُ وينفّذ.
أوصِ — يهيّئ الوكيلُ الإجراء؛ ويوافق عليه إنسانٌ قبل تشغيله.
نفّذ وراجِع — ينفّذ الوكيل؛ ويراجع إنسانٌ لاحقاً ويستطيع التراجع.
نفّذ ضمن الحدود — يعمل الوكيلُ وحده داخل قائمة سماحٍ محدّدةٍ ويُصعِّد كلّ ما يخرج عنها.

ما يحدّد الدرجةَ هو قابلية التراجع: فكلّما سهُل التراجعُ عن خطوة، أمكن السماحُ للوكيل بالصعود أعلى بأمان. وقد وجدت Anthropic أنّ نسبةً صغيرةً فقط من إجراءات الوكيل غير قابلةٍ للتراجع فعلاً — لكنّ تلك القلّة تتضاعف آثارها إن عوملت الضوابطُ كأمرٍ لاحق.[4] ولاحِظ أنّ السُّلّم يتوقّف عمداً: حتى الدرجة العليا تُبقي إنساناً يراقب وحدّاً قائماً. لا توجد درجةٌ «بلا تدخّلٍ بشريّ» البتّة. ابدأ كلّ وكيلٍ من أدنى درجةٍ مفيدة؛ ويكسب الدرجة التالية بسجلِّ أداءٍ مُثبَت، لا بقرار يوم الإطلاق ولا بعرض بائع.

إغلاق المفاصل، بالترتيب

معظمُ تجارب الوكلاء الرائدة لا تصل إلى الإنتاج — فقد وجدت دراسةُ MIT لعام 2025 أنّ الغالبية العظمى من المؤسسات لم تَرَ عائداً ملموساً على النتيجة النهائية، والسببُ غالباً هو نموذج التشغيل المحيط بالوكيل لا النموذج نفسه. لذا رتّب الأمر:

اختر سير عملٍ واحداً محدوداً وقابلاً للتراجع — لا الأخطر ولا الأكبر؛ حيث يكون الخطأ رخيصاً وقابلاً للإلغاء.
املأ المخطّط. الخانات الفارغة هي قائمةُ تحقّقك قبل النشر.
اضبط الاستقلالية على أدنى درجةٍ مفيدة، واربط كلّ حاجزٍ بضابطٍ حقيقي — مفروضٍ خارج الوكيل — قبل الإطلاق. هذا هو مفصلُ العملية–الضابط، وقد أُغلِق.
شغّله خلف نقطة المراجعة البشرية وراقب المقياسين من اليوم الأول.
ارفعه في السُّلّم فقط حين تستحقّ الأدلّةُ ذلك.
أعِد استعمال المخطّط لسير العمل التالي. الثاني يأخذ جزءاً يسيراً من الوقت — وهذا التكرار هو كيف يتراكم نموذجُ التشغيل ميزةً.

افعل ذلك فتبقى النيّةُ المرسومةُ في القمّة حتى ما يفعله النظام. تلك هي اللعبةُ كلّها.

لماذا يؤتي هذا ثماره

لا يخلق الوكيلُ القادرُ قيمةً إلا داخل هذه البنية — والبنيةُ هي ما تملكه فعلاً. النموذجُ مُستأجَر؛ ويمكنك أنت ومنافسُك استئجارَ النموذج نفسه هذا الأسبوع. أمّا انضباطُ إغلاق المفاصل — المخطّط والضوابط وسجلّ الأداء — فهو ملكُك. والاقتصادُ يؤكّد ذلك: دراسةٌ تلو الأخرى تجد أنّ الخوارزمية جزءٌ صغير ممّا يفصل الشركاتِ التي تجني قيمةً من الذكاء الاصطناعي؛ والأغلبيةُ الساحقة هي البشرُ والعمليات.[1] ومعظمُ تجارب الوكلاء الرائدة لا تصل إلى الإنتاج — وحين تتعثّر، يكون السببُ غالباً نموذجَ التشغيل المحيط بالوكيل لا النموذجَ نفسه.[2][3]

انظر إلى الخانة B: البيانات والوصول المحوكَمة. الوكيلُ الذي يعمل على بياناتٍ غير محوكَمةٍ ليس إلا طريقةً سريعةً لأتمتة أسوأ مدخلاتك — وهو مفصلُ جودة البيانات الذي افتتحتُ به، لكن بسرعة الآلة الآن. ولهذا أُدير جرين داتا وAiconomica كنصفين لسلسلة قيمةٍ واحدة، كما يصفها إطار الجناحين للذكاء الاصطناعي: اضبط أساسَ البيانات ونموذجَ التشغيل معاً، وتكون على الطريق لتحويل الذكاء الاصطناعي الوكيل إلى أرباح.

ابدأ بسير عملٍ واحدٍ وصفحةٍ واحدة. يستعير المخطّطُ انضباطَ الصفحة الواحدة من تقليد مخطّط نموذج العمل (business model canvas) — الشكلُ قديم؛ والجديدُ هو وضعُ صلاحيات وكيلٍ واحدٍ وضوابطه، عبر الطبقات الثلاث، على ورقةٍ واحدةٍ لا مكان فيها للمفاصل أن تختبئ. وإن أردتَ رأياً ثانياً في أوّل مخطّطٍ لك، فذلك هو عملُ نموذج التشغيل الذي مارستُه عبر تحوّلاتٍ مؤسسية، موجَّهاً الآن إلى الوكلاء. لنتحدّث.

المراجع

BCG، «أين القيمة في الذكاء الاصطناعي؟» (2024) — نحو 10% خوارزميات، و20% بيانات وتقنية، و70% بشر وعمليات.
Deloitte، «إعادة التفكير في نماذج التشغيل للبشر مع الوكلاء» (2026).
MIT NANDA، «فجوة الذكاء الاصطناعي التوليدي: حالة الذكاء الاصطناعي في الأعمال» (2025) — الغالبية العظمى من المؤسسات لم تُبلِغ عن عائدٍ ملموسٍ على النتيجة النهائية من الذكاء الاصطناعي التوليدي.
Anthropic، «قياس استقلالية وكلاء الذكاء الاصطناعي» (2026).