مقالات عامة

‏ما هي البيانات الضخمة (Big Data) ؟

ما هي البيانات الضخمة ؟

البيانات الضخمة هي بيانات لها حجم كبير جدا و يزداد حجمها بشكل تصاعدي مع الوقت.

البيانات الضخمة ذات حجم كبير و معقدة بحيث لا تستطيع أنظمة تخزين ومعالجة البيانات التقليدية التعامل معها.

أمثلة على البيانات الضخمة:
بيانات أسواق الأوراق المالية و الأسهم

مثال: سوق الأوراق في نيويورك ينتج تيرابايت واحد كل يوم

‏- بيانات التواصل الاجتماعي

مثال: فيسبوك تنتج 500 تيرابايت بشكل يومي

‏- بيانات انترنت الأشياء والمدن الذكية

اذا نحن نتكلم عن أحجام بيتابايت فما فوق.

أنواع البيانات الضخمة:

1- بيانات منظمة (structured)

‏2- بيانات غير منظمة (unstructured)

‏3- بيانات منظمة جزئيا (semi-structured)

البيانات المنظمة (structured):

هي البيانات التي لديها نمط وهيكل واضح لشكل البيانات و طريقة تنظيمها. وبالتالي معروف مسبقا كيفية قرائتها أو اضافة بيانات جديدةعليها.

مثال: قواعد البيانات مثل MySQL

البيانات الغير منظمة (unstructured):

عكس البيانات المنظمة، هي البيانات التي ليس لديها نمط أو هيكل معروف وواضح لشكل البيانات و طريقة تنظيمها. وبالتالي من الصعبتحليلها وقرائتها

مثال: صور وملفات مرئية و ملفات نصية….

البيانات المنظمة جزئياً (semi-structured):

هي تعتبر بيانات منظمة الى حد ما ولكن لم يتم تعريفها

مثال: ملفات ال XML تعتبر ملفات تحتوي على بيانات بشكل منظم ولكن لا يوجد تعريف لطريقة تنظيم البيانات في داخل الملف

خصائص البيانات الضخمة:

‏1- الحجم (volume)

‏2- التنوع (veriety)

‏3- السرعة (velocity)

‏4- التغير (variability)

هذه الخصائص تفدينا لتصنيف البيانات التي لدينا على أنها ضخمة أم عادية

تنوع البيانات:

البيانات الضخمة تعتبر متنوعة (منظمة وغير منظمة) و تأتي من العديد من المصادر و بشتى الاشكال و بتعريفات مختلفة.

تخيل أن تكون البيانات هي عبارة عن صور و ملفات مرئية و ملفات نصية و ملفات log و ملفات pdf و اكسيل و powerpoint و أيضاقواعد بيانات SQL و NoSQL

سرعة البيانات:

مصطلح سرعة البيانات يعود الى سرعة انتاج البيانات. مثال: 500 تيرابايت في اليوم.

البيانات الضخمة يجب أن تملك سرعة هائلة.

تغير البيانات:

معنى هذه الخاصية هو أن البيانات المتوقع ادخالها أو انتاجها متقلبة و غير ثابتة بين الحين والأخر. يعني أحيانا تكون ناقصة، و أحياناتكون فيها اضافات أكثر. وأحيانا نحصل على المطلوب

البيانات الضخمة تعتبر متغيرة

فوائد البيانات الضخمة؛

‏1- يتم استخدامها في الذكاء الاصطناعي و أتمتة الآلة لاستشراف المستقبل و المساعدة على اتخاذ القرارت

‏2- تحليل بيانات العملاء يساعد على خدمتهم بشكل أفضل

‏3-  نستطيع عمل بحيرة بيانات (data lake) لتخزين البيانات في مكان معين و العودة اليها عند احتياجها.

زر الذهاب إلى الأعلى