غير مصنف

هل تستطيع البيانات الضخمة أن تساهم في حل المشاكل العالمية؟

إن قدرتنا على جمع البيانات يفوق بشكل كبير قدرتنا على الاستفادة منها واستخدامها حيث يمكن لهذه البيانات الضخمة أن تكون مفتاحًا لحل احدى أكبر التحديات العالمية التي نواجهها اليوم.

على سبيل المثال، أمراض المتفشية المنقولة عبر المياه نتيجة لحروب أو الكوارث الطبيعية، احدى هذه الأمثلة يمكن ملاحظتها في اليمن حيث وفقًا لأحدث التقارير الأسبوعية فإن أكثر من 10 ألاف حالة يشبه في اصابتها بداء الكوليرا-كما أن السجلات الصحية مليئة بحالاتٍ مماثلة.

ماذا لو كان بإمكاننا استيعاب العوامل البيئية بطريقة أفضل تساهم في التعرف على الأمراض، ليس هذا بحسب بل ويتضمن أيضًا التنبؤ بأكثر المجتمعات عرضًة لأمراض الخطيرة وتقديم حلول ووسائل وقائية لمنع انتشار الأوبئة؟  الإجابة على هذه الأسئلة وأسئلةٍ مشابهة يمكن أن تساعد في تجنب حدوث الكوارث وتفشي الأمراض.

كما ويعمل العالم اليوم على جميع البيانات المتعلقة بكل المجالات المختلفة، من معدلات الوفيات والمواليد حتى معدل محاصيل الزراعية والتدفق المروري. وتقدر شركة (IBM) أنه 2.5 كوينتليون بايت من البيانات يتم انشاءها يوميًا*.

* لتوضيح ذلك: هذا يعادل جميع البيانات التي يتم انتاجها في مكتبة الكونغرس-أكثر من 166000 معلومة يوميًا، ومع ذلك فإنا لا نستغل هذا الكم العظيم من البيانات!

فقد حان الوقت لتغيير ذلك بفضل التطورات الحديثة في تحليل البيانات والخدمات الحاسوبية، حيث لدينا جميع الأدوات اللازمة للقيام بذلك. على الرغم من كون التنبؤات التي نحصل عليها غير مثالية لكنها واعدة، حيث أن الهدف هو ربط المعلومات بتدفق البيانات لتحسين نماذج البيانات والقدرة على التنبؤ الدقيق.

لكن عملية تدفق البيانات المتعددة عملية حرجة خصوصَا فيما يتعلق بالبيانات المستندة على الحقائق (مثل الاستطلاعات والاحصائيات) والسبب في ذلك أن البيانات التي نقوم بجمعها غالبًا ما تكون متأخرة وغير حيادية، مشتتة وغير صحيحة، والمفاجئ أنها قد تكون غير موجودة أصلًا.

على سبيل المثال، معرفة تأثير البعوض على المجتمعات من الممكن أن يساعد في التنبؤ بخطر الأمراض المنقولة من البعض مثل حمى الضنك كونها السبب الرئيسي للوفاة في المناطق الاستوائية. بالرغم من أن البيانات الموجودة حول البعوض بشكل عالمي وحتى محلي غير متوفرة.

وللتخلص من هذه الفجوة المعلوماتية يعمل الباحثون على استخدام مصادر مختلفة مثل صور الأقمار الصناعية، البيانات المناخية والديموغرافية لتقدير مخاطر حمى الضنك. على وجه الخصوص فقد نجح الباحثون من التنبؤ بانتشار حمى الضنك في البرازيل على المستوى الإقليمي والمحلي والبلديات باستخدام تدفقات البيانات (Data streams) وبيانات الترصد الاكلينيكية والمتلازمات واستعلامات بحث قوقل التي تستخدم مصطلحات ذات علاقة بالمرض.

كذلك بالمثل في توقع موسم الانفلونزا، حيث وُجد أن البحث عبر ويكيبيديا وجوجل يمكن أن تساهم في إتمام البيانات الاكلينيكية نظرًا لأن معدل الأشخاص الذين يبحثون على الانترنت عن أعراض الانفلونزا بمجرد ظهورها وهذا يمكّن من رفع درجة التنبؤ بالبيانات الاكلينيكية المتأخرة.

كما ويتم استخدام هذه المفاهيم لتوسيع نطاق الأبحاث بشكل يتجاوز حتى مجرد التنبؤ بالمرض بل فهم مشاعر الناس عامة. حيث تم اجراء دراسة في جامعة كاليفورنيا مدتها ثلاث سنوات باستخدام تدفق البيانات المتباينة لفهم إذا ما كانت الآراء المعبر عنها عبر خرائط التواصل الاجتماعي هي نفس الآراء المعبر عنها في الاستطلاعات.

عل سبيل المثال في كولومبيا يتم اجراء دراسة لرؤية أي من منشورات وسائل التواصل الاجتماعي حول عمليات السلام بين الحكومة و فارك (قوات كولومبيا الثورية المسلحة) باستخدام بيانات مسح البيانات الحقيقة (ground-truthed with survey data) حيث يجري باحث من جامعة كاليفورنيا في بيركلي استطلاعات ميدانية في جميع أنحاء كولومبيا بما المناطق الريفية المعزولة لاستطلاع المواطنين حول عملية السلام، وفي الوقت نفسه يعمل باحثون آخرون في  مكتبة لوس ألاموس  على تحليل البيانات التي يتم تداولها باستخدام وسائل الاعلام الاجتماعية ومصادر الأخبار من المناطق ذاتها لتحديد ما اذا كانت متوافقة مع بيانات التي تم الحصول عليها من الاستطلاعات الميدانية.

إذا ما تم اثبات أن وسائل التواصل الاجتماعية تجسد بدقة مشاعر السكان ” الناس” فقد تكون بديًلا (سهل الوصول، في الوقت المحدد، وبسعر معقول) عن الاستطلاعات الميدانية باهضة الثمن والتي تتطلب تحديات لوجستية خصوصًا في حالة التنبؤ بالأمراض حيث اذا تم استخدام المنشورات على وسائل التواصل الاستخدام كأداة للتنبؤ بحالات تفشي الأمراض فمن الممكن استخدام هذه البيانات في الحملات التعليمية لإعلام المواطنين بخطورة تفشي المرض (بسبب عدم الحصول على اللقاح على سبيل المثال) وتقليل الخطر من خلال تعزيز السلوكيات الوقائية مثل ( غسل اليدين، ارتداء الأقنعة وعدم الخروج والخ)

كل هذا يوضح امكانية البيانات الضخمة على حل المشكلات الكبيرة. مكتبة لوس ألاموس وغيرها من المكتبات التي تعتبر مستودعًا لأكبر أجهزة الحاسوب العملاقة العالمية التي تمتلك قوة حاسوبية يمكن تعزيزها عبر التعلم الآلة وتحليل البيانات للتعامل معها وإعادة صياغتها على شكل قصة لا تخبرنا فحسب عن دولة معينة بل العالم ككل. المعلومات متاحة وموجودة; آن الوقت لاستخدامها!