|
وصف المادة |
:
يقدم هذا المساق مفاهيم "البيانات الضخمة" و "تحليل البيانات". يوفر مقدمة إلى أحد الأدوات والبرمجيات الأكثر شيوعًا، Hadoop، الذي جعل تحليل البيانات الضخمة أسهل وأكثر سهولة. في نهاية هذه المساق، يُتوقع من الطلاب أولاً، وصف موضوع البيانات الضخمة بما في ذلك أمثلة لمشاكل البيانات الضخمة في التطبيقات الواقعية بما في ذلك المصادر الرئيسية الثلاثة للبيانات الضخمة: الأشخاص والمؤسسات وأجهزة الاستشعار. ثانيًا، اشرح قيم V للبيانات الضخمة (volume, velocity, variety, veracity, and value) ولماذا يؤثر كل منها على جمع البيانات والمراقبة والتخزين والتحليل وإعداد التقارير. ثالثًا، الحصول على بعض الخبرة العملية مع بعض الأدوات والتقنيات الشائعة الاستخدام لمعالجة البيانات (الضخمة). رابعًا، تعرف على أساسيات أنظمة الملفات الموزعة وقواعد البيانات والحوسبة. خامساً، لاكتساب مهارات عملية في معالجة البيانات باستخدام ادوات عمل كـ MapReduce / Apache Hadoop و Apache Spark و H2O Framework و TensorFlow |