اكتشاف الأمراض برصد صوت السعال عبر الذكاء الاصطناعي

اقتصادنا – دبي
قام فريق بقيادة علماء غوغل بتطوير أداة للتعلم الآلي يمكنها المساعدة في اكتشاف الحالات الصحية ومراقبتها من خلال تقييم الضوضاء مثل السعال والتنفس، كما أودرت مجلة “نايتشر”. وقد يستخدم الأطباء نظام الذكاء الاصطناعي (AI)، الذي تم تدريبه على ملايين المقاطع الصوتية للأصوات البشرية، يوماً ما لتشخيص الأمراض بما في ذلك كوفيد-19 والسل ولتقييم مدى كفاءة عمل رئتي الشخص.

وليست هذه هي المرة الأولى التي تستكشف فيها مجموعة بحثية استخدام الصوت كمؤشر حيوي للمرض. وقد اكتسب هذا المفهوم اهتماماً كبيراً خلال جائحة كوفيد-19، عندما اكتشف العلماء أنه من الممكن اكتشاف أمراض الجهاز التنفسي من خلال سعال الشخص.

ولكن الجديد في نظام غوغل – المسمى Health Acoustic Representations (HeAR) – هو مجموعة البيانات الضخمة التي تم تدريبه عليها، وحقيقة أنه يمكن ضبطها بدقة لأداء مهام متعددة

ويقول الباحثون، الذين أعلنوا عن الأداة في وقت سابق من هذا الشهر في نسخة أولية لم تتم مراجعتها بعد، إنه من السابق لأوانه معرفة ما إذا كان HeAR سيصبح منتجاً تجارياً. وفي الوقت الحالي، تهدف الخطة إلى منح الباحثين المهتمين إمكانية الوصول إلى النموذج حتى يتمكنوا من استخدامه في تحقيقاتهم الخاصة. ويقول سوجاي كاكارماث، مدير المنتجات في غوغل في مدينة نيويورك والذي عمل في المشروع: “هدفنا كجزء من أبحاث غوغل هو تحفيز الابتكار في هذا المجال الناشئ”.

كيفية تدريب النموذج الخاص بك
يتم تدريب معظم أدوات الذكاء الاصطناعي التي يتم تطويرها في هذا المجال على التسجيلات الصوتية – على سبيل المثال، للسعال – المقترنة بالمعلومات الصحية عن الشخص الذي أصدر الأصوات. على سبيل المثال، قد يتم تصنيف المقاطع للإشارة إلى أن الشخص كان مصاباً بالتهاب الشعب الهوائية في وقت التسجيل. وتأتي الأداة لربط ميزات الأصوات بملصق البيانات، في عملية تدريب تسمى التعلم الخاضع للإشراف.

ويقول يائيل بنسوسان، اختصاصي الحنجرة في جامعة جنوب فلوريدا في تامبا: “في الطب، تقليدياً، كنا نستخدم الكثير من التعلم الخاضع للإشراف، وهو أمر رائع لأنه لديك التحقق من الصحة السريرية. الجانب السلبي هو أنه يحد حقاً من مجموعات البيانات التي يمكنك استخدامها، نظراً لوجود نقص في مجموعات البيانات المشروحة

وبدلاً من ذلك، استخدم باحثو غوغل التعلم الخاضع للإشراف الذاتي، والذي يعتمد على بيانات غير مصنفة. ومن خلال عملية آلية، استخرجوا أكثر من 300 مليون مقطع صوتي قصير للسعال والتنفس وتطهير الحلق وأصوات بشرية أخرى من مقاطع فيديو “يوتيوب” المتاحة للجمهور

وتم تحويل كل مقطع إلى تمثيل مرئي للصوت يسمى المخطط الطيفي. ثم قام الباحثون بحجب أجزاء من المخططات الطيفية لمساعدة النموذج على تعلم التنبؤ بالأجزاء المفقودة. وهذا مشابه لكيفية تعليم نموذج اللغة الكبير الذي يقوم عليه برنامج الدردشة “تشات جي بي تي” للتنبؤ بالكلمة التالية في الجملة بعد تدريبه على عدد لا يحصى من الأمثلة من النص البشري. باستخدام هذه الطريقة، أنشأ الباحثون ما يسمونه النموذج الأساسي، والذي يقولون إنه يمكن تكييفه للعديد من المهام