في زمن التكنولوجيا الرقمية المتطورة والسريعة، أصبحت البيانات محيطةً بنا من كُل جانبٍ وموجودةً في كُل مكانٍ من حولنا، وذلك نتيجة تزايد استخدام الإنترنت والتكنولوجيا بشكلٍ كبيرٍ وهائلٍ في العالم أكمله، ويتزايد حجم البيانات الرقميّة الموجودة في عالمنا ويتزايد تأثيرها في تغيير حياتنا بشكلٍ سريعٍ جدًا ويتضاعف هذا الحجم كل عامين، حيث تقول دراساتٌ قامت بها فوركس بأن سيتم إنشاء ورفع حوالي 1.7 ميغابايت من المعلومات الجديدة في كل ثانية تمر من حياة كل إنسانٍ على وجه الأرض، مما يجعل مجال البيانات يتطور بشكلٍ كبيرٍ ويرتفع شأنه وأهميته في مستقبل عالمنا وحياتنا، واليوم سوف نستطلع على من علوم البيانات وكذلك تحليل البيانات الضخمة وغيرها من الأمور التي تتعلق بهذا الموضوع.[1]
مفهوم تحليل البيانات الضخمة
تحليل البيانات الضخمة يعني استخدام التقنيات التحليليّة المُتقدمة لتحليل وفهم مجموعات ضخمة وكبيرة من البيانات التي تختلف بأشكالها وأنواعها، ويشمل هذا العلم أو المجال بالغ الأهمية تحليل البيانات المُنظمة، وشبه المُنظمة، وغير المُنظمة القادمة من مُختلف المصادر وبمُختلف الأحجام ابتداءً من التيرابايت وصولًا إلى الزيتابايت، حيث تُتيح تلك العملية الفرصة للباحثين والمحللين وأصحاب الأعمال الكبيرة لاتخاذ القرارات بشكلٍ أفضل وأكثر سرعة، ويعتبر علم تحليل البيانات من العلوم التي تشكل الركيزة الأساسية لعلوم الحاسب والهندسات التقنيّة والبرمجيّة، ويتم تدريسها بشكلٍ كبيرٍ في الجامعات الأكاديمية في عصرنا هذا.
مفهوم البيانات الضخمة
هو مصطلحٌ حديثٌ يتم إطلاقه على أي مجموعةٍ من البيانات ذات الحجم الكبير التي يصعب على قواعد البيانات التقليديّة والموجودة في الحواسيب العادية معالجتها، وإدارتها، والتعامل معها أو الاستجابة لها بشكلٍ سريعٍ كما تفعل مع البيانات الأقل حجمًا، حيث تمتلك البيانات الضخمة العديد من الخصائص المُعقدة والتي تصعب مهمة تحليلها على الحواسيب العاديّة، وتتمثل هذه الخصائص والصفات بكبر الحجم والتنوع الكبير في أنواع ومصادر البيانات، وتنتج هذه من أجهزة الاستشعار وأجهزة الفيديو والصوت، وتصدر هذه البيانات أيضًا عن الشبكات والإنترنت ووسائل الإعلام، أي تنتشر بشكلٍ كبيرٍ وعلى نطاقٍ واسعٍ في أيامنا هذه.[2]
تاريخ وأهمية تحليل البيانات الضخمة
إنّ مفهوم البيانات الضخمة وتحليلها موجودٌ منذ سنواتٍ عديدةٍ مضت، ففي خمسينيات القرن الماضي وقبل أن يكون مُصطلح البيانات الضخمة موجودًا أو معروفًا في العالم، كانت الشركات تستخدم التحليل البسيط من خلال أساسيات التحليل التي تعتمد على الأرقام وجداول بيانات التحليل بشكلٍ يدويٍّ، وغالبًا ما كانت تستهلك هذه العملية من التحليل الكثير من الوقت للقيام بها، كما أنها تكشف القليل من البيانات فقط وتعطي نتائجَ بسيطةً نوعًا ما.لكن، مع تطور تكنولوجيا المعلومات والاتصالات وقواعد البيانات، تطور مفهوم تحليل البيانات وقدم للبشرية الفوائد الجديدة والمهمة جدًا، والتي تتمثل بشكلٍ أساسيٍّ بتقديم السرعة والكفاءة في التحليل، الأمر الذي أدى إلى زيادة التنافس بين المؤسسات والشركات في مختلف مجالات عملها للعمل بشكلٍ أسرع، وإليك أبرز الفوائد المُهمة التي تقدمها عملية تحليل البيانات الضخمة بالاعتماد على نظم تحليلة خاصة على أجهزة حاسوب تمتلك قواعد بيانات كبيرة، وقدرة عالية على الحوسبة والمعالجة:
آلية عمل تحليل البيانات
في أغلب الأحيان، تستخدم الشركات منصات التخزين كمحطةٍ أوليةٍ لتخزين البيانات الضخمة قبل نقلها لقاعدة البيانات التحليليّة، وبمجرد أن تصبح البيانات كاملةً وجاهزةً، يتم تحليلها بوساطة برامج تحليل عالية الجودة، والتي تعتبر كثيرةً في الأسواق، حيث تمتلك هذه البرامج أدواتٍ خاصةً للقيام بعملية التحليل، وأبرز هذه الأدوات:
المراجع
- 1 - Data Science vs. Big Data vs. Data Analytics , May/23/2020 | 04:53 AM .
- 2 - Big data analytics , May/23/2020 | 04:54 AM .
- 3 - Big Data Analytics , May/23/2020 | 04:54 AM .
- 4 - big data analytics , May/23/2020 | 04:54 AM .