Големи данни 3 Vs - концепции и модели

Съдържание:

Големи данни 3 Vs - концепции и модели
Големи данни 3 Vs - концепции и модели

Видео: Големи данни 3 Vs - концепции и модели

Видео: Големи данни 3 Vs - концепции и модели
Видео: CS50 2016 Week 0 at Yale (pre-release) - YouTube 2024, Може
Anonim

Терминът "данни" не е нещо ново за нас. Това е едно от основните неща, които се преподават, когато избирате за информационни технологии и компютри. Ако можете да си спомните, данните се считат за сурова форма на информация. Макар че вече там за едно десетилетие, терминът Голяма информация е бръмча тези дни. Както става ясно от термина "товари и данни", това е "Голяма информация" и може да се обработва по различни начини, като се използват различни методи и инструменти за осигуряване на необходимата информация. Тази статия говори за понятията "Big Data", използвайки 3-те, споменати от Дъг Лани, пионер в областта на складирането на данни, за който се смята, че инициира областта на Infonomics (Информационна икономика).

Преди да продължите, можете да прочетете статиите ни "Основи на големи данни и използване на големи данни", за да разберете същността. Те биха могли да добавят към този пост за по-нататъшно обяснение на концепциите за Big Data.
Преди да продължите, можете да прочетете статиите ни "Основи на големи данни и използване на големи данни", за да разберете същността. Те биха могли да добавят към този пост за по-нататъшно обяснение на концепциите за Big Data.

Големи данни 3 Vs

Данните, в своята огромна форма, натрупани по различни начини, бяха подадени правилно в различни бази данни по-рано и бяха изхвърлени след известно време. Когато се появи концепцията, че колкото повече са данните, толкова по-лесно е да разберете - различна и подходяща информация - използвайки правилните инструменти, фирмите започват да съхраняват данни за по-дълги периоди от време. Това е като добавянето на нови устройства за съхранение или използването на облака за съхранение на данните под каквато и да е форма на данните: документи, електронни таблици, бази данни и HTML и т.н. След това се подреждат в подходящи формати, като се използват инструменти, способни да обработват огромни парчета Данни.

ЗАБЕЛЕЖКА: Обхватът на Big Data не се ограничава до данните, които събирате и съхранявате във вашите помещения и в облака. Той може да включва данни от различни други източници, включително, но не само, публични домейни.

Триизмерният модел на големи данни се основава на следните V's:

  1. Обем: отнася се до управлението на съхранението на данни
  2. Скорост: се отнася до скоростта на обработка на данните
  3. Разнообразие: се отнася за групиране на данни от различни, привидно несвързани набори от данни

Следващите параграфи обясняват моделирането на Big Data, като разказват подробно за всяко измерение (всеки V).

A] Обем на големи данни

Говорейки за Големите данни, може да се разбере обем като огромна колекция от сурова информация. Макар че това е вярно, става дума и за разходите за съхранение на данни. Важни данни могат да се съхраняват както в помещенията, така и в облака, като последният е гъвкав вариант. Но трябва ли да съхранявате всичко и всичко?

Според Whitepaper, публикуван от Meta Group, когато обемът на данните се увеличава, части от данни започват да изглеждат ненужни. Освен това тя заявява, че трябва да се запази само този обем данни, които предприятията възнамеряват да използват. Други данни могат да бъдат отхвърлени или ако фирмите не са склонни да пуснат "предполагаемо незначителни данни", те могат да бъдат изхвърлени на неизползвани компютърни устройства и дори на касети, така че предприятията да не плащат за съхранение на такива данни.

Използвах "предполагаемо маловажни данни", защото и аз вярвам, че всякакъв вид данни могат да бъдат изискани от който и да е бизнес в бъдеще - рано или късно - и по този начин трябва да се съхранява за доста време, преди да разберете, че данните наистина които не са от значение. Лично аз изхвърлям по-стари данни на твърди дискове от миналото и понякога на DVD-та. Основните компютри и хранилището за облаци съдържат данните, които смятам за важни и знам, че ще използвам. Сред тези данни също има данни, които могат да се окажат на един стар твърд диск след няколко години. Горният пример е само за вашето разбиране. Няма да отговаря на описанието на Big Data, тъй като сумата е доста по-малка в сравнение с това, което предприятията възприемат като "Голяма информация".

B ] Скорост в големи данни

Скоростта на обработка на данните е важен фактор, когато говорим за концепции за големи данни. Има много уебсайтове, особено електронната търговия. Google вече призна, че скоростта, при която натоварването на страница е от съществено значение за по-добро класиране. Освен класацията, скоростта осигурява и комфорт на потребителите, докато пазаруват. Същото важи и за данните, които се обработват за друга информация.

Докато говорим за скоростта, е важно да знаем, че тя е извън просто по-висока честотна лента. Той съчетава лесно използваеми данни с различни инструменти за анализ. Лесно използваемите данни означават някои домашни задания за създаване на структури от данни, които са лесни за обработка. Следващото измерение - "Разнообразие", разпространява допълнителна светлина върху това.

С] Разнообразие от големи данни

Когато има товари и много данни, става важно да ги организирате така, че инструментите за анализ да могат лесно да обработват данните. Има и инструменти за организиране на данни. При съхранение данните могат да бъдат неструктурирани и във всякаква форма. От вас зависи да разберете каква връзка има с вас с други данни. След като разберете връзката, можете да вземете подходящите инструменти и да преобразувате данните в желаната форма за структурирано и сортирано хранилище.

Image
Image

резюме

С други думи, 3D моделът на Big Data се основава на три измерения: данни на USABLE, които притежавате; подходящо маркиране на данните; и по-бърза обработка. Ако тези три се грижат, данните ви могат лесно да бъдат обработени или анализирани, за да разберете каквото искате.

Горното обяснява и двете концепции и триизмерния модел на Big Data. Статиите, свързани във втората алинея, ще докажат допълнителна подкрепа, ако сте запознати с концепцията.

Ако искате да добавите нещо, моля, коментирайте.

Препоръчано: