Big Data V – Big Datanın xüsusiyyətlərini və ya problemlərini təmsil edir

Big Data V – Big Datanın xüsusiyyətlərini və ya problemlərini təmsil edir

Hər kəs Big Datanı 3 və ya 4 və ya 10 V dəsti ilə müəyyən edir. Bu V əslində bizə Big Data konsepsiyasının tərifini verir, yoxsa bizə deməyə çalışdıqları başqa bir şeydir? Bu V əsaslı xarakteristikadan istifadə etməyin əsas səbəbi bu Big Data ilə dolu olan problemləri vurğulamaqdır. Çətinliklər – çəkmə, təmizləmə, kurasiya, inteqrasiya, saxlama, emal və daha çox.

Bu V-lər özünüzü ehtimal olunan Çağırışlara hazırlamaq üçün göstərişlər verir. Big Datanızı idarə etməyə başladığınız zaman qarşınıza çıxa biləcək çətinliklər:

>

  • Böyük həcmlərdə artır
  • Böyük sürətlə böyüyür
  • Böyük çeşidlər yaradır
  • Böyük Dəyişkənliklə Dəyişikliklər
  • Böyük Dəqiqliyi qorumaq üçün proses tələb olunur
  • Transformasiya böyük vizuallaşdırma verir
  • böyük gizli dəyərlər
  • Bu V-lər Big Data və Big Data Strategiyasının mühüm aspektlərini izah edir və təşkilatın gözardı edə bilməz. Böyük Verilənlərin müxtəlif atributlarına töhfə verən bütün V-lərə baxaq:

    1. Həcmi:

    Facebook-a gündəlik 100 terabayt məlumat yüklənir; Akamai onlayn reklamları hədəfləmək üçün gündə 75 milyon hadisəni təhlil edir; Walmart hər saatda 1 milyon müştəri əməliyyatını həyata keçirir. İndiyə qədər yaradılmış bütün məlumatların 90%-i son 2 il ərzində yaradılıb.

    Yuxarıdakı rəqəmlər həqiqətən Böyük Həcmli verilənlər dedikdə bunun nə demək olduğunu göstərir. Verilənlərin bu ilk xüsusiyyətləri onu böyük verilənlərə çevirir. Bu böyük həcmli məlumat öz növbəsində bu məlumatları saxlamaqda bizə çətinlik yaradır.

    Həmçinin Baxın: Ən Yaxşı 19 Pulsuz Məlumat Mədən Aləti

    2. Sürət:

    1n 1999, hər günün hər dəqiqəsində biz YouTube-a 100 saatlıq video yükləyirik, 200 milyondan çox e-poçt göndərir və 300.000 tvit göndəririk.

    Həcm nömrələrinin altında yatan daha böyük tendensiya, yəni mövcud məlumatların 90%-i yalnız son iki ildə yaradılmışdır. Bu, məlumatların yaradılması, saxlanması, təhlili və vizuallaşdırılması sürətini və ya sürətini təsvir edir.

    Təşkilatların qarşısında duran vəzifə verilənlərin real vaxt rejimində yaradılması və istifadə edilməsində böyük sürətin öhdəsindən gəlməkdir.

    3. Variety

    Keçmişdə yaradılan bütün məlumatlar strukturlaşdırılmış verilənlər idi, o, sütun və sətirlərdə səliqəli şəkildə yerləşdirilmişdi, lakin o günlər geridə qaldı. Bu gün yaradılan məlumatların 90%-i strukturlaşdırılmamış, bütün forma və formalarda gəlir – geo-məkan məlumatlarından tutmuş məzmun və əhval-ruhiyyə baxımından təhlil edilə bilən tvitlərə qədər. foto və video kimi vizual məlumatlar.

    Çoxluluq böyük verilənlərin ən böyük problemlərindən birini təsvir edir. O, strukturlaşdırılmamış ola bilər və o, XML-dən videoya və SMS-ə qədər çoxlu müxtəlif növ məlumatları ehtiva edə bilər. Verilənlərin mənalı şəkildə təşkili sadə məsələ deyil, xüsusən də məlumatın özü sürətlə dəyişdikdə.

    4. Dəyişkənlik

    Dəyişkənlik çox vaxt Variety ilə qarışdırılır. Bunu ayırd etmək üçün sadə bir misal: Starbucks-ı düşünün – onun Soyuq Qəhvədə çoxlu ləzzətləri var. Bu müxtəliflikdir. Tutaq ki, hər gün Cafe Mocha alırsınız və onun dadı və qoxusu hər gün əvvəlkindən bir qədər fərqlidir. Bu, Dəyişkənlikdir.

    Böyük məlumat kontekstindəki dəyişkənlik bir neçə fərqli şeyə aiddir. Biri verilənlərdəki uyğunsuzluqların sayıdır. Hər hansı bir mənalı analitikanın baş verməsi üçün bunlar anomaliya və kənar göstəricilərin aşkarlanması üsulları ilə tapılmalıdır. Böyük verilənlər çoxlu fərqli məlumat növləri və mənbələrindən yaranan çoxlu məlumat ölçülərinə görə də dəyişkəndir. Dəyişkənlik həmçinin verilənlər bazanıza böyük verilənlərin yüklənməsinin qeyri-sabit sürətinə də aid ola bilər.

    Həmçinin Baxın: Ən Yaxşı Oflayn Məlumat Təmizləmə Alətləri

    5. Dəqiqlik

    Big Data-nı başa düşmək üçün vacib olan onun qarışıq, səs-küylü təbiəti və təhlilə başlamazdan əvvəl dəqiq məlumat toplusunun istehsalına sərf olunan işin miqdarıdır. Təhlil edilən məlumatların qeyri-dəqiq və ya natamam olması faydasızdır.

    Məlumat axınları müxtəlif siqnal-küy nisbətləri ilə müxtəlif formatları təqdim edən müxtəlif mənbələrdən gəldiyi zaman yaranır. Big Data Analytics-ə çatana qədər bu yığılmış səhvlərlə dolu ola bilər.

    Dəqiqlik məlumatların dəqiqliyinə əmin olmaqdan ibarətdir və bu, pis məlumatların sistemlərinizdə yığılmasının qarşısını almaq üçün proseslər tələb edir. Ən sadə misal, marketinq avtomatlaşdırma sisteminizə saxta adlar və qeyri-dəqiq əlaqə məlumatları ilə daxil olan kontaktlardır. Verilənlər bazanızda Mickey Mouse-u neçə dəfə görmüsünüz? Bu, klassik “zibil gir, çöp at” çağırışıdır.

    6. Vizuallaşdırma

    Bu, Böyük Verilənlərin çətin hissəsidir və uğursuzluq bu böyük həcmli məlumatı yararsız edir. İstənilən Big Data emal sistemi üçün əsas vəzifə onun nəhəng miqyasını asanlıqla başa düşülən və həyata keçirilə bilən bir şeyə çevirməkdir. İnsan istehlakı üçün bunun üçün ən yaxşı üsullardan biri onu qrafik formatlara çevirməkdir.

    Mövcud böyük verilənlərin vizuallaşdırılması vasitələri texniki problemlərlə üzləşir. yaddaşdaxili texnologiyanın məhdudiyyətləri və zəif miqyaslanma, funksionallıq və cavab müddəti. Ənənəvi qrafiklər bir milyard məlumat nöqtəsinin planlaşdırılması ehtiyacını ödəyə bilməz, ona görə də məlumatların klasterləşdirilməsi və ya ağac xəritələri, günəş şüaları, paralel koordinatlar, dairəvi şəbəkə diaqramları və ya konus ağaclarından istifadə kimi verilənləri təmsil etməyin müxtəlif yollarına ehtiyacınız var.

    7 . Dəyər

    Dəyər son oyundur. Big Data-nın potensial dəyəri böyükdür. Çox vaxt və səy tələb edən həcm, sürət, müxtəliflik, dəyişkənlik, doğruluq və vizuallaşdırmaya diqqət yetirdikdən sonra təşkilatınızın məlumatlardan dəyər əldə etdiyinə əmin olmaq vacibdir.

    Əlbəttə ki, , məlumatların özü heç də dəyərli deyil. Dəyər həmin verilənlər üzərində aparılan təhlillərdə və verilənlərin məlumata necə çevrildiyi və nəticədə biliyə çevrilməsindədir.

    Yuxarıdakı 7 V sizə Big Datanın 3 mühüm aspektindən, yəni tərif, xüsusiyyətlər və çətinliklər. Ancaq insanlar yuxarıda qeyd olunan 7 V-nin Çətinlikləri ilə qarşılaşmaq üçün üsullar icad etmək üçün böyük məlumatlar üzərində araşdırma aparmağa başlayanda bəzi digər V-lərlə qarşılaşdılar. Baxmayaraq ki, onlar böyük datada mühüm rol oynamırlar, lakin Xüsusiyyətlər və Problemlər siyahısını tamamlayırlar.

    8. Etibarlılıq

    Doğruluğa bənzər, etibarlılıq məlumatların təyinatı üzrə istifadəsi üçün nə qədər dəqiq və düzgün olmasına aiddir. Böyük verilənlərin doğruluğu etibarlılıq məsələsidir, yəni məlumatların nəzərdə tutulan istifadə üçün düzgün və dəqiq olması deməkdir. Aydındır ki, etibarlı məlumatlar düzgün qərarlar qəbul etmək üçün açardır. Verilənlərin yoxlanılması məlumatın pozulmamış ötürülməsini təsdiq edən bir üsuldur.

    9. Yaşayış qabiliyyəti

    Sadəcə aşağıdakı ifadələrə fikir verin:

  • Günün və ya həftənin gününün alış davranışına hansı təsiri var?
  • Aşağıdakı ifadələr üzərində fikirləşin. Twitter və ya Facebook alışların artması və ya azalmasının xəbərini qeyd edir?
  • Coğrafi yer, məhsulun mövcudluğu, günün vaxtı, alış tarixçəsi, yaş, ailənin ölçüsü, kredit limiti və nəqliyyat vasitəsinin növü proqnozlaşdırmaq üçün necə birləşir istehlakçının satın almağa meyli?
  • Bizim birinci vəzifəmiz həmin məlumatların həyat qabiliyyətini qiymətləndirməkdir, çünki effektiv proqnozlaşdırıcı modelin qurulmasında nəzərə alınmalı olan çoxlu sayda məlumat və dəyişənlərlə biz tez və ucuz qiymətə tam xüsusiyyətli modelin yaradılmasına sərmayə qoymazdan əvvəl müəyyən dəyişənin aktuallığını effektiv şəkildə yoxlayın və təsdiqləyin. Başqa sözlə, biz bu fərziyyəni növbəti hərəkətə keçməzdən əvvəl təsdiq etmək istəyirik və bu fərziyyənin həyat qabiliyyətini müəyyən etmək ilkin fərziyyəmizin bir hissəsi olmayan digər dəyişənlərin bizim istədiyimiz və ya müşahidə edilən nəticələrə mənalı təsir edib-etmədiyini müəyyən etmək üçün baxışımızı genişləndirə bilərik.

    10. Dəyişkənlik

    Datanızın əhəmiyyətsiz, tarixi və ya artıq faydalı hesab edilməməsi üçün onun neçə yaşı olmalıdır? Məlumatların nə qədər müddətə saxlanması lazımdır?

    Big Datanın dəyişkənliyindən danışarkən, biznesimizdə hər gün tətbiq etdiyimiz strukturlaşdırılmış məlumatların saxlanma siyasətini asanlıqla xatırlaya bilərik. Saxlama müddəti başa çatdıqdan sonra biz onu asanlıqla məhv edə bilərik.

    Böyük verilənlərin sürəti və həcminə görə, lakin onun dəyişkənliyi diqqətlə nəzərdən keçirilməlidir. İndi siz məlumat valyutası və əlçatanlığı üçün qaydalar yaratmalı, həmçinin tələb olunduqda məlumatın sürətli axtarışını təmin etməlisiniz.

    11. Zəiflik

    2015-ci ildə Ashley Madison Hack-i xatırlayırsınız? Yoxsa 2016-cı ilin may ayında CRN-nin “Peace adlı hakerin 167 milyon LinkedIn Hesabı və MySPace İstifadəçiləri üçün 360  milyon e-poçt və parol haqqında məlumatları ehtiva edən məlumatları satmaq üçün qaranlıq internetə yerləşdirdiyini bildirmişdi.

    Böyük. Məlumat özü ilə yeni təhlükəsizlik narahatlıqları gətirir. Xüsusilə bu xüsusiyyətlərlə Big Data üçün təhlükəsizlik proqramının hazırlanması çətinləşir. Axı məlumatların pozulması böyük bir pozuntudur.

    Bütün bunlar bizə Big Datanın təbiəti haqqında nə deyir? Yaxşı, o, kütləvi və sürətlə genişlənir, lakin eyni zamanda səs-küylü, qarışıq, daim dəyişən, yüzlərlə formatda və təhlil və vizuallaşdırma olmadan faktiki olaraq dəyərsizdir.

    Həcm, sürət və müxtəliflik təkcə əsas parametrlər deyil. Big Data-nın, lakin onlar həm də Big Data konsepsiyasının və normal verilənlərlə Big Data arasında əsas ayıran xüsusiyyətlərin yaranmasının səbəbidir. Onlar Big Datanın özünə xas olsa da, digər V-nin Dəyişkənliyi, doğruluğu, vizuallaşdırılması və dəyəri Big Datanın onu emal edən, təhlil edən və ondan faydalananlara təqdim etdiyi nəhəng mürəkkəbliyi əks etdirən mühüm atributlardır.

    Şübhəsiz ki, Big Data korporativ İT-nin düzgün hesablama infrastrukturu ilə uyğunlaşdırmalı olduğu əsas tendensiyadır. Lakin hər şeyi başa düşmək üçün yüksək performanslı analitiklər və məlumat alimləri olmadan, biznes üstünlüyünə çevrilən dəyər yaratmadan sadəcə Böyük Xərclər yaratmaq riskini daşıyırsınız.

    oxumaq: 0

    yodax