شركات تُهشمُ آلاف النوافذ لتصميم تقنيات للذكاء الاصطناعي

مصدر الصورة Audio Analytic
Image caption في إحدى التجارب، جمع فريق معني بتصميم برامج الذكاء الاصطناعي آلافاً من الألواح الزجاجية الخاصة بالنوافذ والأبواب لتهشيمها

لا تميز أجهزة الكمبيوتر بين صوت تهشم الزجاج أو نباح الكلاب، أو بكاء الأطفال الرضع، فكلها بالنسبة لها ليست سوى ضوضاء. لكن ثمة جهوداً تُبذل حالياً لـ"تعليم" جيلٍ جديدٍ من الأجهزة المزودة بتقنيات الذكاء الاصطناعي كيفية الاستماع لهذه الأصوات وتمييزها.

بدأ الأمر بزيارة إلى إحدى حظائر الطائرات العازلة للصوت في قاعدة للسلاح الجوي الملكي البريطاني، في مكانٍ ما شمال مدينة كمبريدج بالمملكة المتحدة. ففي تلك القاعدة، التي لا تبعد كثيراً عن المدينة، ينهمك كريس ميتشل وزملاؤه في تعليم أجهزة الكمبيوتر الخاصة بهم درساً، باستخدام مطارق ثقيلة.

فقد جمع الفريق آلافاً من الألواح الزجاجية الخاصة بالنوافذ والأبواب، من مختلف الأشكال والأحجام، بهدف تهشيمها واحداً تلو الآخر، وتسجيل الأصوات الناجمة عن ذلك، والتي تختلف من نوعٍ لآخر.

يُهشم الزجاج أحياناً بمطرقة ثقيلة أو مجرفة كتلك المستخدمة في زراعة الحدائق، بينما يُكسر في أحيانٍ أخرى عبر قذفه بالحجارة.

ويبرر ميتشل الجهود التي يبذلها فريقه في هذا الشأن بالقول: "نقلل تماماً من أهمية الفوضى التي يمكن أن تنجم" عن عدم قدرة أجهزة الكمبيوتر هذه، على التمييز بين الأنواع المختلفة للأصوات التي تسمعها. ويؤكد كذلك أننا لا ندرك "كم سيكون هذا الأمر مرهقاً بالنسبة لنا".

أهلا بكم عند أقصى حدودٍ بلغتها تقنيات "الذكاء الاصطناعي" حتى الآن، فيما يتعلق بتمييز الأصوات. ولعل الوقت قد حان لنتعرف على ميتشل نفسه، فهو مؤسس شركة ناشئة تحمل اسم "أوديو أناليتيك"، ويتولى رئاستها التنفيذية كذلك.

وتعمل شركته، ومقرها مدينة كمبريدج، على تدريب "نظام تعلم آلي"، وهو أحد فروع ما يُعرف بـ"الذكاء الاصطناعي"، على كيفية التعرف على أصوات تهشم الزجاج.

ولا يقتصر الأمر على الزجاج فحسب؛ فالشركة "تُعلّم" أجهزة الكمبيوتر كيفية رصد أصواتٍ أخرى، ذات أهميةٍ للإنسان، مثل الأصوات التي تصدرها أجهزة إنذار الحرائق، وأصوات صياح الأطفال، ونباح الكلاب.

ويتمثل هدف ذلك في إكساب ما يُعرف بـ"تقنية المنزل الذكي" القدرة على التعرف على الأصوات وتمييزها، دون الخلط - مثلاً - بين صوت سقوط كوب وصوت تحطم زجاج نافذة، وذلك لجعل هذه التقنية قادرةً على تنبيهك إذا ما اقتحم دخيلٌ منزلك، أو شرع طفلك في البكاء.

في السنوات القليلة الماضية، أصبحت أجهزة الكمبيوتر بارعةً للغاية في فهم العالم من حولها، ولكن من الوجهة البصرية، إلى حد أن الأجهزة المزودة بتقنية "الذكاء الاصطناعي"، صارت أفضل من الإنسان فيما يتعلق بالتعرف على أشياءٍ بعينها، لاسيما الوجوه.

ولكن التعرف بدقة شديدة على الأصوات لم يُولَ اهتماماً يذكر، إلا فيما يتعلق بالتعرف على صوت البشر خلال الحديث، وهو ما يدخل في صميم تطبيقاتٍ مثل "سيري" الذي توفره شركة "آبل"، و"غوغل هوم" الذي تقدمه شركة "غوغل"، و"أليكسا" التابع لشركة "أمازون" .

ولذا يشكل الصخب الذي تعج به الحياة اليومية مجرد جلبة وضجيج في خلفية المشهد، بالنسبة لغالبية أجهزة الكمبيوتر.

لكن ميتشل يريد تغيير ذلك، ويقول : "ما نعمل على إنجازه حالياً يتعلق بمجالٍ جديد من مجالات الذكاء الاصطناعي، نطلق عليه اسم الذكاء الاصطناعي في مجال الصوتيات، وهذا أمرٌ لم يتصدي له أحد من قبل بشكلٍ ذي مغزى".

مصدر الصورة Getty Images
Image caption يتعقب الفريق، بالتعاون مع أطباء بيطريين، أكبر عدد ممكن من سلالات الكلاب المختلفة لتسجيل نباحها

وتندرج شركة "أوديو أناليتيك" في إطار موجةٍ جديدة من الشركات التي تُدرّب "نظم التعلم الآلي" على رصد وتحديد الأنماط المُمَيَزة التي تتضمنها الأصوات التي تتردد من حولنا.

فشركة "أوبركورد" ومقرها برلين، تُطوّر تقنية "ذكاء اصطناعي" يمكن أن تساعد من يريد تعلم العزف على القيثارة "الغيتار"، عبر تزويدها بتسجيلاتٍ لك وأنت تداعب الأوتار بأصابعك، ما يجعلها قادرةً على تنبيهك حينما تحرك هذه الأصابع على نحو خاطئ.

وتستثمر شركة "آبي رود ستوديوز"، التي جرى فيها يوماً ما تسجيل ألبومات فريق "البيتلز"، أموالاً في "أوبركورد"، وفي العديد غيرها من شركات تقنيات "الذكاء الاصطناعي" المهتمة بالصوتيات.

في السياق نفسه، تُدَرِبُ شركة أخرى تحمل اسم "كمبريدج كونسلتانتس" الأجهزة المزودة بتقنية "الذكاء الاصطناعي" على التمييز ما بين الأنواع المختلفة للمقطوعات المعزوفة على البيانو؛ مثل الـ"راجتايم" و"الباروك".

ويحمل البرنامج المُستخدم في هذا الشأن اسم "أفشيونادو"، وجرى تطويره عبر الاستعانة ببضع مئاتٍ من الساعات لتسجيلات للموسيقى المعزوفة على البيانو. ويشمل ذلك معزوفاتٍ لمحترفين، وتسجيلاتٍ مصورةٍ لهواة، تم تحميلها من على موقع "يوتيوب".

ويقول مونتي بارلو من "كمبريدج كونسلتانتس" إن الشركة عَمِدَت إلى أن تكون التسجيلات التي زُود بها هذا البرنامج غير مكتملة أو متسقة، وذلك لإكسابه القدرة على التعامل مع العزف الحي على البيانو بكل ما يتحلى به من طابع معقدٍ للغاية بالنسبة لتقنية تتعلق بالذكاء الاصطناعي.

لكن الهدف من مثل هذا البرنامج لا يتمثل فقط في أغراض شكلية أو كمالية، بل تبين أن تدريبه على التمييز بين الأنماط المختلفة للموسيقى وإكسابه المقدرة على تجاهل عوامل غير ذات صلة بما يُعزف أحياناً، مثل إيقاع النغمة وقوتها، وطبيعة الجَرْس الخاص بها، يفيدان في جعله قادراً على رصد وجود أنماطٍ بعينها في ما يُدخل إليه من بياناتٍ صوتية تتسم بالتعقيد بشكل عام، بغض النظر عما تمثله هذه البيانات.

وستكون المهمة الأولى لـ" أفشيونادو" في هذا الصدد التعرف - عبر هذه القدرة الجديدة - على الأعطال الموجودة في شبكاتٍ للاتصالات.

غير أن لدى شركة "أوديو أناليتيك" طموحاتٍ أكبر بكثير، إذ تسعى - كما يقول ميتشل - إلى وضع تصنيفٍ تندرج في إطاره كل الأصوات "وهذه مهمة ضخمة للغاية".

ففي الوقت الراهن، يُمكن للبرمجيات التي طورتها هذه الشركة التعرف على الأصوات الناتجة عن تكسير زجاج النوافذ، وبكاء الأطفال، وكذلك عن عمل أجهزة الإنذار من انبعاث دخان.

وفي معرضٍ نُظم الأسبوع الماضي في مدينة لاس فيغاس الأمريكية، للأجهزة الإلكترونية التي يهتم بها المستهلكون العاديون، أُضيفت أصوات نباح الكلاب إلى هذه القائمة.

كما تعكف الشركة حالياً على تطوير أجهزة استشعارٍ قادرةٍ على رصد أي أصوات خارجة عن مألوف سياقٍ صوتي معين، أو بعبارة أخرى التعرف على أي تغيير يطرأ على الخلفية الصوتية المعتادة الحافلة بالضجيج، مثل حدوث جلبة ناتجة عن سقوط شخصٍ ما من علٍ، أو انبعاث صوت مياهٍ تتسرب من الأنابيب.

وتريد "أوديو أناليتيك" أن تضيف إلى هذه القائمة - في نهاية المطاف - الأصوات التي تطلقها أجهزة الإنذار ضد سرقة السيارات.

وربما تُضاف للسوق الأمريكي خصيصاً أصوات طلقات الرصاص كذلك. وتسعى الشركة إلى أن يتسنى لها بعد ذلك بيع حق استخدام منظومات التعرف على الأصوات هذه وتمييزها، إلى شركات إنتاج الأدوات التي يُستعان بها في تقنية "المنزل الذكي".

مصدر الصورة Audio Analytic
Image caption قد يتسنى لتقنية "المنزل الذكي" تحذيرك إذا ما اقتحم دخيلٌ منزلك، حال اكتسابها القدرة على التمييز بين صوت سقوط كوب زجاجي وصوت تحطم زجاج نافذة

وترى نينا بهاتيا، المديرة العامة لشركة "هايف" المتخصصة في الأنظمة الذكية للإضاءة وتنظيم الحرارة ومقرها بريطانيا، أنه من المهم بالنسبة للأجهزة المزودة بتقنيات "الذكاء الاصطناعي" اكتساب القدرة على التمييز بين الأصوات المختلفة.

وتضيف قائلة: "بسرعة بالغة، بات من المهم قطعاً بالنسبة لتقنيات المنزل الذكي، أن تتحلى بالقدرة على رصد وتفسير عددٍ كبيرٍ ومتنوع من الأصوات الموجودة في محيط المنزل، بما يُمَكِنُ (أصحابه) من التصرف بسرعة وسهولة مع ما يحدث فيه، عندما يكونون خارجه".

وتوضح بالقول: "يمكن أن تُنبه إلى أن جرس الإنذار جراء انبعاث دخان قد قُرِعَ (في منزلك) خلال وجودك في اجتماعٍ بمكان عملك، وليس بالضرورة وأنت جالسٌ على أريكتك" بداخل المنزل.

وبجانب إصدار تنبيهات يتلقاها صاحب المنزل على هاتفه المحمول، بوسع هذه التقنيات التصرف من تلقاء نفسها كذلك. فانبعاث صوت تهشم زجاج قد يدفع تقنيات "المنزل الذكي" إلى إضاءة الأنوار، كما قد يقود صدور صوت بكاء طفل إلى إضاءة مصابيح تصدر ضوءاً خافتاً ملائماً لفترة الليل، وتشغيل أغنية تساعد على النوم من مكبر صوتٍ قريب.

وبالفعل، تستخدم شركة إلكترونيات صينية تحمل اسم "سينغلد" التقنيات التي طورتها "أوديو أناليتيك"، وذلك في إطار تصنيعها مصباحاً ذكياً مُزوداً بمكبر للصوت مُدمجٌ في قاعدته.

ويُستعان بهذه التقنيات أيضاً من جانب شركاتٍ أخرى تعمل في مجال توفير تقنيات "المنزل الذكي".

وتضيف هذه الشركات تقنيات "أوديو أناليتيك" إلى أجهزتها، بما فيها أجهزة تنظيم الحرارة التي تحظى بفرصة جيدة لرصد الأصوات والتعرف عليها، بحكم أنها تُوضع غالباً في موقعٍ مركزيٍ في المنزل.

لكن الجزء العسير هنا يتمثل في التيقن من أن تقنية "الذكاء الاصطناعي" المستخدمة قادرةٌ على التعرف على ما "تسمعه" من أصوات على نحو دقيق، لأن فشلها في ذلك ومن ثم إصدارها تحذيراتٍ خاطئة، قد يسبب فوضى وخسائر.

فتلك التقنيات تجيد عملها فقط إذا ما كانت تتعامل مع أصواتٍ دُرِبت على التعرف عليها. ويقول ميتشل في هذا الشأن :"الذكاء الاصطناعي عديم الفائدة على نحو مقيت، ما لم تكن لديك بياناتٌ" تزوده بها.

ولا يشكل الحصول على هذه البيانات أمراً يسيراً. ويقول ميتشل وزملاؤه إنهم هشموا الزجاج "لأسابيع تلو أخرى، وبعض هذه الألواح الزجاجية كانت عبارة عن واجهات كاملة لمحال، تمتد من الأرض إلى السقف. ويعني قيامك بتهشيمها إمكانية أن تُقطع قدمك، أو ساقك، مع سقوط الزجاج لأسفل".

أما جمع تسجيلاتٍ كافية لأصوات بكاء الأطفال الرضع، فقد استلزم أن تتعاون الشركة مع مجموعات من الآباء والأمهات في كمبريدج. ويقول ميتشل إن الشركة اضطرت لوضع معجمٍ خاصٍ بها لتوصيف وتصنيف الأنواع المختلفة لأصوات البكاء التي يجري تسجيلها.

مصدر الصورة Thinkstock
Image caption هناك نوعٌ من الببغاوات يصدر صوتاً يحاكي فيه - على نحو غريب للغاية - الصوت الصادر من أجهزة الإنذار من انبعاث دخان.

وأوضح بالقول: "أطلقنا مثلاً وصف 'بكاء مُعبر' على نمط خشنٍ للغاية من البكاء بدا أنه يأتي من الجزء الخلفي من الحلق".

أما بالنسبة للكلاب فكان الأمر أسهل نوعاً ما، إذ تعاونت الشركة في ذلك مع أطباء بيطريين، ساروا مع العاملين فيها جنباً إلى جنب لتعقب أكبر عدد ممكن من سلالات الكلاب المختلفة، بدءاً من كلب "البكيني" ذي الحجم الصغير للغاية، وحتى نوع "الكلب الدنماركي الضخم" الذي قد يصل حجمه إلى حجم الأريكة، وذلك لجمع تسجيلات لنباح تلك الكلاب، وتزويد منظومة "الذكاء الاصطناعي" بها.

من جهة أخرى، اشترت "أوديو أناليتيك" - عبر شبكة الإنترنت - أكبر عدد ممكن من الطُرز المختلفة لأجهزة الإنذار من انبعاث دخان، وذلك لتزويد التقنيات الخاصة بالشركة بالقدرة على تمييز الأصوات الصادرة عن تلك الأجهزة، التي باتت المئات منها مكدسةً على الأرفف في المكاتب.

في البداية، واجهت منظومة "الذكاء الاصطناعي" المُستخدمة في هذا الإطار مشكلة عدم القدرة على التفرقة ما بين رنات التنبيه التي تصدر للتحذير من انبعاث الدخان، وتلك الرنات الأخرى التي يمكن أن تُسمع في أجواء المنزل بفعل عمل أجهزة أخرى، مثل رنات الهواتف، أو الساعات المُنبهة، أو أجهزة التوقيت المُثبتة في المواقد.

ولذا جرى تزويد تلك المنظومة ببيانات من شأنها إكسابها القدرة على التركيز ليس فقط على نغمة رنة التحذير ومدتها، وإنما كذلك على فترة السكون الفاصلة بين كل رنة وأخرى، وهي الفترة التي تختلف بحسب طبيعة ووظيفة الجهاز الذي يُصدرها.

لكن المفاجآت تبقى واردة، مهما بلغ عدد النوافذ التي هشمتها الشركة، أو أجهزة الإنذار التي اشترتها، وبدأت في تشغيلها، في سياق تدريب منظومتها على التعرف على الأصوات بدقة.

فهناك نوعٌ من الببغاوات يصدر صوتاً يحاكي فيه - على نحو غريب للغاية - الصوت الصادر من أجهزة الإنذار من انبعاث دخان. وهو ما دفع "أوديو أناليتيك" إلى تطوير منظومتها بشكل يُمَكِنُها من تجاهل مثل تلك الإنذارات الكاذبة من ذلك الطائر.

كما تريد الشركة "تدريب" منظومتها للذكاء الاصطناعي على التنبه للتغيرات التي تطرأ على مستوى علو صوت المرء ونبرته، حينما يطلق صيحاتٍ عدوانية، كتلك التي تصدر عندما يهدد شخصٌ ما بالإقدام على العنف، على سبيل المثال.

ويقول ميتشل إن هذيّن العامليّن لا يختلفان كثيراً باختلاف الثقافات أو اللغات. فالتغييرات الملحوظة على الأصوات الصادرة من الفم تحدث - في هذه الحالة - بفعل تدفق مادة "الأدرينالين" في الدم، وانتشارها في أنحاء مختلفة من الجسم، ما يجعلها تؤثر على الحنجرة.

لكن شركة "أوديو أناليتيك" اضطرت إلى إرجاء المضي قدما في هذا الطريق في الوقت الراهن. فقد اكتشفت أن أصوات الدجاج، وآلات المنشار في منطقةٍ ما، قد تسترعي انتباه خاصية تمييز الأصوات العدوانية الموجودة في منظومتها للتعرف على الأصوات.

إنه لعالم صاخبٌ بحق. وقد بدأت تقنيات "الذكاء الاصطناعي" في الإنصات لما يموج به من ضجيج وما يحفل به من أصوات.

يمكنك قراءة الموضوع الأصلي على موقع BBC Future .

المزيد حول هذه القصة