Big Data چیست - توضیحی ساده با مثال

اصطلاح Big Data تقریباً در همه جای کره زمین - آنلاین و آفلاین - به طور فزاینده ای استفاده می شود. و فقط مربوط به کامپیوتر نیست. این اصطلاح تحت یک اصطلاح عمومی به نام فناوری اطلاعات(Information Technology) آمده است که در حال حاضر تقریباً بخشی از سایر فناوری ها و زمینه های مطالعاتی و تجاری است. Big Data چیز مهمی نیست. هیاهویی که در اطراف آن وجود دارد مطمئناً یک معامله بسیار بزرگ است که شما را گیج می کند. این مقاله نگاهی به داده های بزرگ(Big Data) می اندازد . همچنین حاوی نمونه ای از نحوه استفاده NetFlix از داده های خود، یا بهتر است بگوییم، Big Data برای ارائه بهتر نیازهای مشتریان خود است.

کلان داده چیست

کلان داده چیست

داده‌های موجود در سرورهای شرکت شما تا دیروز فقط داده بودند - مرتب شده و بایگانی شده بودند. ناگهان زبان عامیانه Big Data رایج شد و اکنون داده های شرکت شما Big Data هستند. این اصطلاح تک تک داده هایی را که سازمان شما تا به حال ذخیره کرده است را در بر می گیرد. این شامل داده های ذخیره شده در ابرها و حتی URL(URLs) هایی است که نشانک کرده اید. ممکن است شرکت شما تمام داده ها را دیجیتالی نکرده باشد. ممکن است قبلاً تمام داده ها را ساختاربندی نکرده باشید. اما پس از آن، تمام داده‌های دیجیتال، کاغذی، ساختاریافته و غیرساخت‌یافته شرکت شما اکنون به Big Data تبدیل شده‌اند .

به طور خلاصه، تمام داده‌هایی که در سرورهای شما وجود دارند - چه دسته‌بندی شده باشند یا نه، در مجموع BIG DATA نامیده می‌شوند . همه این داده ها را می توان برای به دست آوردن نتایج مختلف با استفاده از انواع مختلف تجزیه و تحلیل استفاده کرد. لزومی ندارد که همه تحلیل ها از همه داده ها استفاده کنند. تجزیه و تحلیل های مختلف از بخش های مختلف BIG DATA برای تولید نتایج و پیش بینی های لازم استفاده می کند.

Big Data اساساً داده‌هایی است که شما برای نتایجی که می‌توانید برای پیش‌بینی و کاربردهای دیگر استفاده کنید، تجزیه و تحلیل می‌کنید. هنگام استفاده از واژه کلان داده(Big Data) ، ناگهان شرکت یا سازمان شما با فناوری اطلاعات(Information) سطح بالا کار می کند تا با استفاده از همان داده هایی که در طول سال ها به طور عمدی یا ناخواسته ذخیره کرده اید، انواع مختلفی از نتایج را استنتاج کند.

بیگ دیتا چقدر بزرگ است

اساساً، تمام داده‌های ترکیبی Big Data هستند، اما بسیاری از محققان توافق دارند که Big Data - به این ترتیب - با استفاده از صفحات گسترده معمولی و ابزارهای منظم مدیریت پایگاه داده قابل دستکاری نیستند. آنها به ابزارهای تجزیه و تحلیل ویژه ای مانند Hadoop نیاز دارند (ما در یک پست جداگانه این موضوع را مطالعه خواهیم کرد) به طوری که همه داده ها می توانند در یک لحظه تجزیه و تحلیل شوند (ممکن است شامل تکرارهای تجزیه و تحلیل باشد).

برخلاف موارد فوق، اگرچه من در این موضوع متخصص نیستم، می‌توانم بگویم که داده‌های هر سازمانی - بزرگ یا کوچک، سازمان‌یافته یا غیرسازمان‌یافته - برای آن سازمان یک داده بزرگ است و سازمان ممکن است ابزارهای خود را برای تجزیه و تحلیل اطلاعات انتخاب کند. داده ها.(Contrary to the above, though I am not an expert on the subject, I would say that data with any organization – big or small, organized or unorganized – is Big Data for that organization and that the organization may choose its own tools to analyze the data.)

معمولاً برای تجزیه و تحلیل داده ها، افراد مجموعه داده های مختلفی را بر اساس یک یا چند زمینه مشترک ایجاد می کردند تا تجزیه و تحلیل آسان شود. در مورد داده های بزرگ(Big Data) ، نیازی به ایجاد زیر مجموعه برای تجزیه و تحلیل آن نیست. ما اکنون ابزارهایی داریم که می توانند داده ها را بدون در نظر گرفتن حجم آنها تجزیه و تحلیل کنند. احتمالاً این ابزارها خودشان داده ها را حتی زمانی که در حال تجزیه و تحلیل هستند طبقه بندی می کنند.

ذکر دو جمله از کتاب "داده های بزرگ" نوشته جیمی گوترمن(Jimmy Guterman) را مهم می دانم :

Big Data: when the size and performance requirements for data management become significant design and decision factors for implementing a data management and analysis system.”

-و-

“For some organizations, facing hundreds of gigabytes of data for the first time may trigger a need to reconsider data management options. For others, it may take tens or hundreds of terabytes before data size becomes a significant consideration.”

بنابراین می بینید که حجم و تحلیل هر دو بخش مهمی از داده های بزرگ(Big Data) هستند.

بخوانید(Read) : داده کاوی چیست؟(What is Data Mining?)

مفاهیم کلان داده

این نکته دیگری است که اکثر مردم با آن موافق نیستند. برخی از کارشناسان می گویند که مفاهیم کلان داده(Big Data Concepts) سه V هستند:

  1. جلد
  2. سرعت
  3. تنوع

برخی دیگر چند V دیگر را به مفهوم اضافه می کنند:

  1. تجسم
  2. صحت (قابلیت اطمینان)
  3. تنوع و
  4. مقدار

من مفاهیم Big Data را در یک مقاله جداگانه پوشش خواهم داد زیرا این پست در حال بزرگ شدن است. به نظر من، سه V اول برای توضیح مفهوم Big Data کافی است.

مثال کلان داده – چگونه NetFlix(Big Data Example – How NetFlix) از آن برای رفع مشکلاتش استفاده کرد

در سال 2008، یک قطعی در نت فلیکس(NetFlix) رخ داد که به دلیل آن بسیاری از مشتریان در تاریکی رها شدند. در حالی که برخی هنوز می توانستند به خدمات پخش دسترسی داشته باشند، اکثر آنها نمی توانستند. برخی از مشتریان موفق به دریافت دی وی دی(DVDs) های اجاره ای خود شدند در حالی که برخی دیگر موفق نشدند. یک پست وبلاگ در وال استریت ژورنال(Wall Street Journal) می گوید که نتفلیکس(Netflix) به تازگی پخش بر اساس تقاضا را آغاز کرده است.

این قطعی باعث شد تا مدیریت در مورد مشکلات احتمالی آینده فکر کند و از این رو; به Big Data تبدیل شد . با استفاده از این داده ها، مناطق پرترافیک، نقاط حساس، و توان عملیاتی شبکه و غیره را تجزیه و تحلیل کرد و روی آن کار کرد تا در صورت بروز مشکل در آینده، با جهانی شدن آن، زمان خرابی را کاهش دهد. در اینجا پیوند(the link) به وبلاگ وال استریت ژورنال(Wall Street Journal Blog) است، اگر می خواهید نمونه های داده های بزرگ(Big Data) را بررسی کنید .

موارد فوق به طور خلاصه بیان می‌کنند که داده‌های بزرگ در یک زبان غیر عادی چیست. می توانید آن را یک مقدمه بسیار ابتدایی بنامید. من قصد دارم چند مقاله دیگر در مورد عوامل مرتبط مانند - مفاهیم(Concepts) ، ​​تجزیه و تحلیل(Analysis) ، ابزارها(Tools) ، و استفاده از Big Data(uses of Big Data) ، Big Data 3 V و غیره بنویسم. در همین حال، اگر مایلید چیزی به موارد فوق اضافه کنید، لطفا نظر دهید و به اشتراک بگذارید. با ما.

در ادامه بخوانید(Read next) : Web Scraping چیست؟



About the author

من یک توسعه دهنده ماهر iOS با بیش از دوازده سال تجربه هستم. من روی هر دو پلتفرم iPhone و iPad کار کرده‌ام و می‌دانم چگونه برنامه‌ها را با استفاده از آخرین فناوری‌های اپل ایجاد و سفارشی‌سازی کنم. علاوه بر مهارت‌هایم به‌عنوان توسعه‌دهنده aiOS، تجربه قوی در استفاده از Adobe Photoshop و Illustrator و همچنین توسعه وب از طریق چارچوب‌هایی مانند WordPress و Laravel دارم.



Related posts