Windows

Big Data 3 Vs - fogalmak és modellek

The Passion Economy: How the Future Works - a Documentary

The Passion Economy: How the Future Works - a Documentary

Tartalomjegyzék:

Anonim

Az "adatok" kifejezés nem új számunkra. Ez az egyik legfontosabb dolog, amit az információtechnológia és számítógépek kiválasztása során tanítanak. Ha vissza tudsz emlékezni, az adatokat az információ nyers formájának tekintjük. Bár már évtizeden át létezik, a Big Data kifejezés napjainkban buzz. Amint a kifejezésből kitűnik, a terhelések és az adatok terhelése Big Data, és különböző módokon dolgozhatók fel különböző módszerek és eszközök segítségével, hogy megkapják a szükséges információkat. Ez a cikk a Big Data koncepciójáról szól, a 3 V-t, amelyet Doug Laney, az adatraktározás területén úttörőnek nevezett, és amelyet Infonomics (Information Economics) területén kezdett el

Mielőtt továbblépne, érdemes elolvasnia a lényegi adatokat a Nagy adatok alapjairól és a Nagy adatok felhasználásáról. Ezeket a feladatokat a Big Data fogalmak további magyarázata céljából adhatják hozzá.

Big Data 3 Vs

A hatalmas formában gyűjtött adatok különböző módokon gyűjtötték össze különböző adatbázisokban korábban, és egy idő után dömpingeltek. Amikor a koncepció kiderült, hogy minél több adat, annál könnyebb megismerni - a különböző és releváns információkat - a megfelelő eszközökkel, a vállalatok hosszabb időre megkezdték az adatok tárolását. Ez olyan, mint az új tárolóeszközök összevonása vagy a felhő használata az adatok tárolására, bármilyen formában az adatok beszerzéséhez: dokumentumok, táblázatok, adatbázisok és HTML stb. Ezután megfelelő formátumba rendezhetők olyan eszközök segítségével, amelyek képesek hatalmas darabok feldolgozására Adatok

MEGJEGYZÉS: A Big Data hatóköre nem korlátozódik az Ön által gyűjtött és tárolt adatokra és a felhőbe. A különböző adattípusokból származó adatokat a különböző forrásokból, köztük a közszférában levő elemekből állíthatjuk be.

A nagy adatok 3D modellje a következő V-eken alapul:

  1. Térfogat: az adattárolás kezelése
  2. Sebesség: az adatfeldolgozás sebessége
  3. Variety: a különböző, látszólag nem kapcsolódó adatkészletek adatainak csoportosítására utal

A következő bekezdések részletesen meghatározzák a Big Data modellezést az egyes dimenziókról (minden V-ről).

A] Nagy adatok mennyisége

A nagy adatokról beszélve a hangerőt a nyers információk hatalmas gyűjteményeként értelmezhetjük. Bár ez igaz, az adatok tárolási költségeiről van szó. Fontos adatok tárolhatók a helyiségekben és a felhőben is, az utóbbi pedig rugalmas lehetőség. De meg kell mindent el kell tárolnia?

A Meta Group által kiadott fehér könyv szerint, amikor az adatok mennyisége nő, az adatok egy része szükségtelenné válik. Ezenkívül kimondja, hogy csak azokat az adatokat kell megőrizni, amelyeket a vállalkozások szándékoznak használni. Más adatok eldobhatók, vagy ha a vállalkozások nem hajlandók elengedni az "állítólag nem fontos adatokat", azokat fel nem használt számítógépes eszközökön és akár szalagon is el lehet dobni, így a vállalkozásoknak nem kell fizetniük az ilyen adatok tárolására.

Én "állítólag nem fontos adatokat" használtam, mert én is úgy gondolom, hogy bármilyen típusú adatok bármely jövőbeli üzleti vállalkozásban - előbb vagy utóbb - a megfelelő időig meg kell őrizni, mielőtt tudni fogják, hogy az adatok valóban nem fontos. Személy szerint régebbi adatokat másoltam a merevlemezekről az elmúlt évekről és néha a DVD-ről. A fő számítógépek és a felhő tároló tartalmazza az általam fontosnak tartott adatokat, és tudom, hogy használni fogom őket. Ezen adatok közül is van olyan egyszer használatos adat, amely néhány év múlva egy régi merevlemezre kijuthat. A fenti példa csak az Ön megértéséhez. Ez nem felel meg a Big Data leírásnak, mivel ez az összeg jóval kisebb, mint amit a vállalatok Big Data-ként érzékelnek.

B ] Veloditás Big Data

Az adatok feldolgozásának sebessége fontos tényező amikor a Big Data fogalmáról beszélünk. Számos weboldal van, különösen az e-kereskedelem. A Google már elismerte, hogy az oldal betöltésének sebessége elengedhetetlen a jobb rangsoroláshoz. A ranglétrán kívül a sebesség a felhasználóknak is kényelmet nyújt, miközben üzletet vásárolnak. Ugyanez vonatkozik más adatok feldolgozására is.

Amíg a sebességről beszélünk, elengedhetetlen tudni, hogy ez túlmutat a magasabb sávszélességen. A könnyen használható adatokat különböző analízis eszközökkel egyesíti. A könnyen használható adatok bizonyos házi feladatokat jelentenek az egyszerű feldolgozású adatszerkezetek létrehozásához. A következő dimenzió - Variety, tovább terjeszti ezt a fényt.

C] Nagy adatok változatossága

Ha terhelés és adattömörség van, fontos lesz megszervezni őket oly módon, hogy az elemzési eszközök könnyen feldolgozhassák adat. Vannak eszközök az adatok szervezéséhez is. A tárolás során az adatok lehetnek strukturálatlanok és bármilyen formában. Önön áll, hogy kitalálja, milyen viszonyban van más adataival. Miután kitaláltuk a kapcsolatot, felvehetjük a megfelelő eszközöket, és átalakíthatjuk az adatokat a kívánt formára strukturált és rendezett tárhelyre.

Összegzés

Más szóval, a Big Data 3D modell három dimenzióra épül: USABLE adatok hogy rendelkezel; az adatok megfelelő címkézése; és gyorsabb feldolgozás. Ha ezeket a három dolgot törődnek, az adatainkat könnyen feldolgozhatja vagy elemezheti, hogy kitaláljon mindent, amit csak akar.

A fentiek mindkét koncepciót és a Big Data 3D modelljét magyarázzák. A második bekezdéshez kapcsolódó cikkek további támogatást jelentenek, ha újak vagyunk a koncepcióhoz.

Ha valamit szeretne hozzáadni, kérjük, mondja meg.