البيانات الضخمة: ما هي الأدوات التي يمكننا استخدامها لفهمها

في المنتدى الاقتصادي العالمي في دافوس هذا العام ، كان الموضوع الجدير بالملاحظة هو البيانات الضخمة. سرعان ما يتم الإعلان عن الثورة الرقمية باعتبارها الثورة الصناعية الرابعة ، مع اندماج العوالم المادية والرقمية والبيولوجية من خلال التكنولوجيا. في الواقع ، شهدت مجالات مثل الروبوتات والذكاء الاصطناعي وإنترنت الأشياء بعض التقدم الهائل.


لكن الحقيقة التي تكمن في جوهر هذه الثورة هي أن مليارات الأشخاص مرتبطون الآن ببعضهم البعض بواسطة أجهزة مثل الهواتف المحمولة ، التي تمتلك قدرة معالجة هائلة وسعة تخزين. وهذا ما جعل ازدهار البيانات الضخمة ممكنًا بعيدًا عن مركز بيانات CERN (والذي يجمع ما يقرب من 30 خماسيًا من البيانات سنويًا) من خلال تجارب مصادم الهدرونات الكبير.
في عام 2015 ، أرسل مستخدمو Facebook ما معدله 31.25 مليون رسالة وشاهدوا 2.77 مليون مقطع فيديو في الدقيقة. وفي غضون خمس سنوات ، سيكون هناك أكثر من 50 مليار جهاز ذكي متصل في العالم ، تم تطويرها جميعها لجمع البيانات وتحليلها ومشاركتها. تتضاعف المعلومات الرقمية ببساطة كل 18-24 شهرًا. على أساس سنوي ، يتزايد حجم المعلومات بمعدلات تتطلب بانتظام المزيد والمزيد من الأدوات المتطورة لتحليلها وهيكلها.

هذا هو المكان الذي تلعب فيه مناهج مثل التعلم العميق. تتمثل فرضية التعلم العميق في الكشف عن النماذج الهرمية الغنية التي تمثل توزيعات احتمالية على أنواع البيانات التي يتم مواجهتها في تطبيقات الذكاء الاصطناعي ، مثل الرموز في مجموعات اللغة الطبيعية. تشارك منظمات مثل Findo في البحث الذي سيساعد في إنشاء نماذج قادرة على فهم البيانات النصية ثم توليدها. هذا “الفهم الحقيقي” ليس سوى خطوة واحدة نحو هدف خلق الإدراك “البشري” الاصطناعي ، والأهداف الشاملة لأبحاث الذكاء الاصطناعي.


فيما يتعلق بهذا ، يعمل Findo على معالجة اللغة الطبيعية في السحب الشخصية للملفات ورسائل البريد الإلكتروني والملاحظات وجهات الاتصال. وهي تعمل أيضًا في مجال منتج للمساعدين الشخصيين والروبوتات. معظم هذه الحلول قائمة على القواعد ولكن وجودها يشير إلى وجود طلب قوي على مثل هذه الحلول. لذلك يعمل Findo على حل مشكلة إنشاء المساعد الشخصي الذكي الذي يساعد العملاء الفرديين على البحث في السحب الشخصية الخاصة بهم. يركز على تحليل البيانات النصية: البريد الإلكتروني ، والملفات ، والملاحظات الموزعة عبر الأجهزة ، والتخزين السحابي ، والعلامات ، والمجلدات.


لا يمثل إنشاء مثل هذا المساعد عقبة في الطريق بقدر ما هو تطوير شبكة تعلم غير خاضعة للإشراف يمكن تدريبها على لغات مختلفة. يمكن التغلب على هذا من خلال دراسة أنماط مثال البحث المثالي ، حيث وجد أنه لا ينبغي العثور على المعلومات بالكلمات الرئيسية الدقيقة ، ولكن عن طريق الوصف. يشار إلى هذا باسم “البحث الذكي”. يعمل Findo أيضًا على نظام يمكنه فهم الأنماط في البيانات الشخصية وتنظيمها في مجلدات. الفكرة هي السماح للمستخدمين بتجربة تجربة “البحث الذكي” أو “اكتشاف المعرفة”.


يمكن تعلم النماذج الإحصائية العميقة التي تحتوي على طبقات عديدة من المتغيرات الكامنة وملايين المعلمات بكفاءة. يمكنهم إظهار تمثيلات الميزات عالية المستوى والروابط أو الروابط المخفية بين البيانات. إنها تسمح بشكل خاص بإنشاء روابط البيانات ديناميكيًا عندما تتغير البيانات بسرعة: عندما تقابل شخصًا جديدًا ، أو يتم تعيينه في شركة جديدة أو بدء مشروع جديد. القواعد الصارمة لن تتحكم فيه.