'විශාල දත්ත' යනු කුමක්ද?

එය විශාල ගනුදෙනුවක් වන්නේ ඇයි?

'බිග් දත්ත' යනු බුද්ධිය පිළිබඳ නව විද්යාව හා නො වකා හරිත දත්ත විශාල පරිමාණ අධ්යයනය කිරීම මගින් මානව හැසිරීම් වලිනි. විශාල දත්ත "අනාවැකි විශ්ලේෂණ" ලෙසද හැඳින්වේ.

ට්විටර් පෝස්ට්, ෆේස්බුක් සංග්රහ, ඊ බේ සෙවුම්, ජීපීඑස් ට්රැකර්ස් සහ ATM යන්තම් විශ්ලේෂණය කර ඇත. ආරක්ෂිත වීඩියෝ දර්ශන, ගමනාගමන දත්ත, කාලගුණික රටා, ගුවන් ගමන් පැමිණීම්, ෆෝන් කුළුණු ලොග් සහ හෘද රෝග ලුහුබැඳීම් වැනි වෙනත් ආකෘති. විශාල දත්ත යනු සතිපතා වෙනස් වන ව්යාකූල නව විද්යාවයි. එය විද්වතුන් කිහිප දෙනෙක් පමණි.

නිශ්චිත ජීවිතයේ විශාල දත්ත වල උදාහරණ මොනවාද?

screenshot http://project.wnyc.org/transit-time

බොහෝ විශාල දත්ත ව්යාපෘති ඉතා අඳුරු වන නමුත් පුද්ගලයන්, සමාගම් සහ ආණ්ඩුවල එදිනෙදා ජීවිතයට බලපාන විශාල දත්තවල සාර්ථක උදාහරණ තිබේ.

වෛරස් වසංගත අනාවැකි: සමාජ-දේශපාලන දත්ත, කාලගුණය සහ දේශගුණික දත්ත, සහ රෝහල් / සායනික දත්ත අධ්යයනය කිරීමෙන් මේ විද්යාඥයින් දැන් ඩෙංගු උණ පැතිරීමේ අනාවැකි සති 4 ක් පූර්ව දැනුම් දීමකින් අනාවැකි පල කරති.

ඝාතන රැල්ල: මෙම විශාල දත්ත ව්යාපෘතිය වොෂිංටන්, ඩීසී හි ඝාතකයින්, සැකකරුවන් සහ අපරාධකරුවන් ඝාතනය කිරීම. මියගිය අය සහ ජනතාව සඳහා දැනුවත් කිරීමේ සම්පතක් ලෙස මෙන්ම මෙම විශාල දත්ත ව්යාපෘතිය සිත් ඇදගන්නා සුළුය.

ට්රාන්ස්ට් ට්රැවල් සැළසුම්, NYC: WNYC රේඩියෝ වැඩසටහන් සම්පාදක ස්ටීව් මෙලෙන්ඩෙස් මගී ගමන් මාර්ගය සමඟ මාර්ගගත කාලසටහන උපලේඛනගත කරන ලදී. ඔහුගේ මැවීම නිව්යෝර්ක් නගරයේ සිතියමේ ඔවුන්ගේ පිහිටීම ක්ලික් කළ අතර දුම්රිය සහ උමං දුම්රිය සඳහා ගමන් කරන කාලය අනාවැකි පල කරනු ඇත.

Xerox ඔවුන්ගේ ශ්රම බලකායේ අලාභය පහත හෙලුවේය: ඇමතුම් මධ්යස්ථානයේ වැඩ කිරීම චිත්තවේගීය ලෙස වෙහෙසකරයි. වෘත්තීය විශ්ලේෂකයින්ගේ සහාය ඇතිව සෙරෝක්ස් දත්ත විශ්ලේෂණයන් අධ්යයනය කර ඇති අතර, දැන් ඔවුන්ගෙන් දිගුකාලීනව සමාගම සමඟ රැඳී සිටින කෝල් කේවල් කුලීකරුවන් කුමන ඇමතුම් මධ්යස්ථානයකින්දැයි සිතාගත හැකිය.

ප්රති-ත්රස්තවාදයට සහාය දීම: සමාජ මාධ්ය, මූල්ය වාර්තා, ගුවන් ගමන් වෙන් කිරීම් සහ ආරක්ෂක දත්ත අධ්යයනය කිරීම, නීති ක්රියාත්මක කිරීම මගින් ත්රස්තවාදී සැකකරුවන් අනාවැකි පළ කළ හැකිය.

සමාජ මාධ්ය සමාලෝචන මත පදනම්ව අලෙවිකරණ අලෙවිකරණය සකස් කිරීම : පුද්ගලයන්ට විවෘතව හා ඉක්මනින් පබ්ලැබ්, ආපනශාලා හෝ සුවඳ විලවුන් සමාජයක ඔවුන්ගේ මාර්ගගත සිතීම් හුවමාරු කර ගැනේ. මෙම මිලියන ගණනක් සමාජ මාධ්ය තනතුරු අධ්යයනය කර ඔවුන්ගේ සේවාවන් ගැන සිතන දේ පිළිබඳව සමාගමට ප්රතිපෝෂණයක් ලබා දිය හැකිය.

විශාල දත්ත භාවිතා කරන්නේ කවුද? ඔවුන් එය කරන්නේ කෙසේද?

පාරිභෝගිකයින්ගේ තෘප්තිමත් භාවය ඉහළ නැංවීම සඳහා බොහෝ තනි ඒකලිත සංගත සිය ගණන් ඉදිරිපත් කිරීම සහ මිල වෙනස් කිරීම සඳහා විශාල දත්ත භාවිතා කරයි.

විශාල වශයෙන් එතරම් විශාල ගනුදෙනුවක් වන්නේ ඇයි?

4 දේවල් විශාල දත්ත වැදගත් වේ:

1. දත්ත විශාලයි. එය එක් දෘඩ තැටියක ගැළපෙන්නේ නැත, USB stick වඩා අඩු ය. දත්ත ප්රමාණය තරමක් දුරට සිතේ තබාගන්න. (සිතිය හැකි බිලියන බිලියන බිලියන එකක් ගැන සිතන්න, ඉන්පසු බිලියන ගණනකින් එය ගුණ කරයි).

2. දත්ත අපැහැදිලි සහ ව්යුහගතව ඇත. විශාල දත්ත කාර්යයන්ගෙන් 50% සිට 80% දක්වා තොරතුරු සොයාගෙන පිරිසිදු කර ගත හැකිය. අපගේ පෘථිවි ග්රහලෝකයේ සිටින දහස් ගණන් විශේෂඥයන් මෙම දත්ත පිරිසිදු කිරීම කරන්නේ කෙසේද යන්න සම්පූර්ණයෙන්ම දන්නවා. මෙම විශේෂඥයන් HPE සහ Hadoop වැනි ඉතා විශේෂිත මෙවලම් අවශ්ය වන්නේ ඔවුන්ගේ යාත්රා කරන්න. සමහර විට වසර 10 කින් විශාල දත්ත විශේෂඥයින් දුසිමක් ඩයිම් එකක් බවට පත්වනු ඇත. එහෙත් මේ වන විට ඔවුන් විශ්ලේෂකයෙකුගේ ඉතා දුර්ලභ විශේෂයක් වන අතර ඔවුන්ගේ වැඩ කටයුතු තවමත් නොපැහැදිලි සහ වෙහෙසකාරී වේ.

3. දත්ත විකිණිය හැකි සහ මිලදී ගත හැකි භාණ්ඩයක් බවට පත් වී ඇත. සමාජ මාධ්ය සහ වෙනත් දත්තවල ටෙරාබයිට් මිලදී ගත හැකි සමාගම් සහ පුද්ගලයන්ට දත්ත වෙළඳපොළවල් පවතී. එක්තරා දෘඪ තැටියකට ගැළපෙන පරිදි එය බොහෝ විට වලාකුළු මත පදනම් වේ. දත්ත මිලදී ගැනීම සාමාන්යයෙන් ඔබ වලාකුළු සර්වර් ගොවිපොළකට සවි කර ඇති දායක ගාස්තුවකි.

** විශාල දත්ත මෙවලම් සහ අදහස් වල නායකයන් ඇමසන්, ගූගල්, ෆේස්බුක් සහ යාහූ. මෙම සමාගම් සිය අන්තර්ජාල සේවා සමඟ මිලියන ගණනක් ජනයාට සේවය කරන බැවින්, එය එකතු කිරීමේ ලක්ෂ්යය සහ දැවැන්ත දත්ත විශ්ලේෂණය පිටුපසින් සිටින දර්ශනය වනු ඇත.

4. විශාල දත්තවල හැකියාව අවසානයි. සමහර විට වෛද්යවරුන් එක් දිනකට පෙර සිදුවන්නේ හෘදයාබාධ හා ස්ට්රැක්ක් අනාවැකි පළ කිරීමට ය. ගුවන් යානා හා මෝටර් රථ කඩා වැටීම් ඔවුන්ගේ යාන්ත්රික දත්ත සහ ගමනාගමනය සහ කාලගුණ රටාවන් පිළිබඳ අනාවැකි විශ්ලේෂණය මගින් අඩු විය හැකිය. ඔබ සඳහා ගැලපෙන අය සිටින පුද්ගලයින් පිළිබඳ විශාල දත්ත අනාවැකිකරුවන් විසින් මාර්ගගත ආලය වැඩි දියුණු කළ හැකිය. සංගීතඥයින් ඉලක්කගත ප්රේක්ෂකයන්ගේ වෙනස් රස බැලීමේ වඩාත් ප්රියජනක වන සංගීත සංයුතිය කුමක්දැයි සොයා බැලීමට හැකිය. පෝෂණවේදීන් විසින් ගබඩා කරන ලද ආහාරවල සංයෝජනයක් සංකෝචනය කිරීම හෝ පුද්ගලයාගේ රෝගී තත්වයන් සඳහා උපකාර කිරීමට හැකි වනු ඇත. පෘෂ්ඨය සීරීමට ලක් වී ඇති අතර විශාල දත්ත වල සොයා ගැනීම් සෑම සතියකම සිදු වේ.

විශාල දත්ත අපහසුයි

මොන්ටිය රක්සෙන් / ගැටි

විශාල දත්ත අනාවැකි විශ්ලේෂණ: විශ්වසනීය දත්ත සොයා ගත හැකි සහ වර්ග කළ නොහැකි දැවැන්ත දත්තයන් පරිවර්තනය කිරීම. මෙය විශේෂිත ආකාරයේ දැනුමක් සහ ඉවසීමක් අවශ්ය වන ව්යාකූල හා ව්යාකූල අවකාශයකි.

උදාහරනයක් ලෙස මොනොලිතික UPS බෙදාහැරීමේ සේවාවක් ලබා ගන්න. රථ වාහන තදබදයට සරිලන පරිදි වඩාත් කාර්යක්ෂම මාර්ග විශ්ලේෂණය කිරීම සඳහා UPS හි වැඩසටහන්කරුවන් ඔවුන්ගේ රියැදුරු ජීපීඑස් සහ ස්මාර්ට්ෆෝන් වෙතින් දත්ත අධ්යයනය කරයි. මෙම ජීපීඑස් සහ ස්මාර්ට්ෆෝන් දත්ත දැඩිලෙස විශ්ලේෂණය සඳහා ස්වයංක්රීයවම සූදානම් නැත. මෙම දත්ත විවිධ ස්මාර්ට් ෆෝන් දෘඩාංග උපාංග හරහා විවිධ ජීපීඑස් සහ සිතියම් දත්ත සමුදායන්ගෙන් ගලා යයි. UPS විශ්ලේෂකයින් මාස ගණනාවක් තිස්සේ එම දත්ත සියල්ල පහසුවෙන් පරිවර්තනය කිරීමට හා වර්ගීකරණය කළ හැකි ආකෘතියකට පරිවර්තනය කර ඇත. එසේ වුවත්, එය වෑයම් කළ හැකි වුවත් එය වටී. මෙම විශාල දත්ත විශ්ලේෂණ භාවිතා කිරීම ආරම්භ කර ඇති නිසා UPS විසින් ඉන්ධන ගැලුම් මිලියන 8 කට වඩා වැඩි ප්රමාණයක් ඉතිරි කර ඇත.

විශාල දත්ත අසීරු වන අතර පිරිසිදු කිරීමට සහ ඒවාට සූදානම් වීම සඳහා එතරම් උත්සාහයක් දරනු ලබන බැවින්, දත්ත විද්යාඥයින් විසින් කරන ලද සියළුම කාර්යය සඳහා දත්ත 'දත්ත සකසන්නන්' ලෙස නම් කර තිබේ. -

කෙසේ වුවද විශාල දත්ත සහ අනාවැකි විශ්ලේෂණ විද්යාව සෑම සතියකම වැඩි දියුණු වේ. 2025 වර්ෂය වන විට සියලුදෙනාටම පහසුවෙන් ප්රවේශ විය හැකි විශාල දත්ත අපේක්ෂා කරන්න.

ලොකු දත්තයක් නොවේ පුද්ගලිකත්වය සඳහා තර්ජනයක් විය හැකිද?

Feingersh / Getty

ඔව්, අපගේ නීති සහ පුද්ගලික රහස්යතා ආරක්ෂාවන් ප්රවේශමෙන් කළමනාකරණය නොකළහොත් විශාල දත්ත පෞද්ගලික පෞද්ගලිකත්වය තුළට පැටලී ඇත. එය පවතින විට, ගූගල් සහ යූ ටියුබ් සහ ෆේස්බුක් දැනටමත් ඔබේ දිනපතා අන්තර්ජාල පුරුදු නිරීක්ෂණය කරති. ඔබගේ ස්මාර්ට් ජංගම දුරකථනය සහ පරිගනක ජීවිතය සෑම දිනකම ඩිජිටල් පාද සටහන් තබයි. නවීන තාක්ෂණික සමාගම් එම පාදයන් අධ්යයනය කරයි.

විශාල දත්ත වටා ඇති නීති වෙනස් වෙමින් පවතී. පුද්ගලිකත්වය යනු ඔබ දැන් පුද්ගලික වගකීමක් ගත යුතු බවය. ඔබ එය තවදුරටත් ප්රකෘති අයිතියක් ලෙස අපේක්ෂා කළ නොහැකිය.

ඔබගේ රහස්යතාව ආරක්ෂා කිරීමට ඔබට කළ හැකි දේ:

ඔබට ගත හැකි විශාලතම පියවර වන්නේ VPN ජාල සම්බන්ධතාවයක් භාවිතා කරමින් ඔබගේ දෛනික පුරුදු වසා ගැනීමටය . VPN සේවාව ඔබගේ සංඥාව පාගා දමනු පිණිස ඔබේ අනන්යතාව සහ ස්ථානය අවම වශයෙන් අර්ධ වශයෙන් දුරේක්ෂයන් හඹායනු ඇත. මෙය ඔබ 100% නිර්නාමිකයක් බවට පත් නොකරනු ඇත, නමුත් VPN විසින් ඔබගේ අන්තර්ජාල පුරුදු නිරීක්ෂණය කරනු ලබන්නේ කොපමණ ප්රමාණයක්ද යන්නයි.

විශාල දත්ත පිළිබඳ වැඩි විස්තර දැන ගත හැක්කේ කොහෙන්ද?

මොන්ටි රස්සුසන් / ගැටි

විශ්වසනීය මනස හා තාක්ෂණ සඳහා වූ ආදරය සඳහා විශාල දත්ත යනු සිත් ගන්නා සුළු දෙයක්. ඔබ එසේ නම්, අනිවාර්යයෙන්ම විශ්මයජනක විශාල දත්ත ව්යාපෘතිවල මෙම පිටුව බලන්න.