پیش نیاز مطالعه درس کلان داده (بیگ دیتا)
- مطالعه درس داده و فراداده (دیتا و متادیتا)
از دوستان عزیز متممی انتظار میرود پس از مطالعه این درس بتوانند
- مفهوم کلان داده یا بیگ دیتا را شرح دهند.
- مدلهای ۳V و ۴V را در تعریف کلان داده توصیف کنند.
- بتوانند چند مثال از کاربردهای کلان داده را فهرست کنند.
کلان داده یا بیگ دیتا (Big Data) را میتوان یکی از اصطلاحات پُرتکرار در حرفها و نوشتههای مربوط به فناوری اطلاعات دانست.
اگر جستجوهای مربوط به کاربرد کلان داده را در گوگل بررسی کنید، میبینید که کاربرد کلان داده در پزشکی، اقتصاد، بانکداری و نیز حسابداری و حسابرسی، صرفاً بخش کوچکی از سوالها و دغدغههای علاقهمندان این حوزه را به خود اختصاص میدهد.
همهی ما با شنیدن بیگ دیتا یا کلان داده تا حدی میتوانیم معنای آن را حدس بزنیم: ظاهراً بحث از حجم دادههاست. حجمی که هر روز نیز رو به افزایش است و هر یک از ما، در هر مقیاسی که فعال باشیم، جلوههایی از آن را مشاهده و تجربه کردهایم.
اما اجازه بدهید برای آشنایی با یک تعریف دقیقتر، به سراغ موسسه گارتنر برویم و تعریف گارتنر را از بیگ دیتا بخوانیم (+):
تعریف کلان داده (گارتنر)
بیگ دیتا (Big Data) به معنای داراییهای اطلاعاتی [یک مجموعه یا سازمان] است که:
- حجم بالا دارند
- با سرعت زیاد تولید میشوند و / یا تنوع گسترده دارند
و نیازمند شیوههای پردازش نوآورانه با هزینهی مناسب هستند تا بتوان از آن برای اتوماسیون فرایندها، تصمیم گیری و بهبود شهود و بینش [در سازمان] بهره گرفت.
در اغلب تعریف های کلان داده، سه اصطلاح حجم (Volume) و سرعت (Velocity) و تنوع (Variety) را میبینید. در حدی که گاهی برای تعریف بیگ دیتا از اصطلاح ۳V استفاده میکنند.
به عنوان مثال، شرکت PWC هم که از بزرگان مشاوره مدیریت در جهان است، بیگ دیتا را با همین ۳V تعریف میکند (+).
اکثر مقالات کتابِ راهنمای کاربردهای بیگ دیتا هم همین تعریف ۳V را مبنای بحث خود قرار دادهاند (+).
فرانسیس باتل نیز در کتاب مدیریت ارتباط با مشتری خود، هنگامی که به بحث CRM تحلیلی میرسد، به سراغ همین الگوی ۳V میرود.
شرکت ارنست اند یانگ هم در راهنمای خود برای آشنایی با کلان داده، همین تعریف را مورد اشاره قرار داده و البته برای اینکه حرف تازهای هم زده باشد، یک V چهارم هم به آن افزوده است (V چهارم، حرف اول Veracity است و به اهمیت دقیق بودن و قابلاتکا بودن دادهها اشاره دارد).
قاعدتاً با این توضیحات، باید قانع شده باشید که الگوی ۳V (یا ۴V) مدل رایج و شناختهشدهای برای تعریف بیگ دیتا است و اکنون میتوانیم به سراغ تعریف دقیقتر این هر یک از این مولفهها برویم.
شاید برای این کار، هیچ منبعی بهتر از یک مقالهی قدیمی (سال ۲۰۰۱) که در آن این کلمات برای نخستین بار مطرح شدهاند نباشد:
کاربردهای کلان داده
وقتی از بیگ دیتا صحبت میکنیم، بیشتر از یک وضعیت حرف میزنیم؛ وضعیتی که در آن حجم زیادی از دادهها، با سرعت زیاد و تنوع گسترده تولید میشوند.
اما اینکه از چنین وضعیتی چگونه میتوان استفاده کرد، نیازمند دانشهای دیگری است. دانشمندان علوم دادهها (Data Scientists)، متخصصان هوش مصنوعی (Artificial Intelligence) و فعالان داده کاوی (Data-mining) از جمله کسانی هستند که میتوانند کاربردهای Big Data را در حوزههای مختلف بیابند و توسعه دهند.
بنابراین با وجودی که اصطلاح کاربردهای کلان داده (Big Data Applications) در فارسی و انگلیسی رایج است و ما هم آن را بهکار میبریم، همواره بهخاطر داشته باشید که منظور، کاربردهای تحلیل کلان دادههاست؛ وگرنه حجم و تنوع دادهها، به خودی خود کاربردی ندارد و اگر تحلیل و پردازش مناسب روی داده های حجیم انجام نشود، این دادهها از منظر مدیریت منابع، با سایر منابع هرز سازمانی تفاوتی نخواهند داشت.
قاعدتاً پرداختن به جزئیات این کاربردها، بحثی تخصصی بوده و فراتر از حوزهی تعریف شده برای درس سواد دیجیتال است. اما شاید نکات زیر بتواند سرنخی برای جستجوهای بیشتر و مطالعات کاملتر شما باشد:
از جمله کاربردهای بیگ دیتا در زندگی روزمره میتوان به سرویس های مسیریابی مانند Waze و بخش Navigation در Google Maps اشاره کرد. حجم قابل توجهی از دادههای مربوط به وسایل نقلیهی در حال حرکت (در واقع: موبایلهای در حال حرکت) به صورت پیوسته و در لحظه، پردازش میشوند و مسیرهای مناسب بر اساس مقصد تعیین شده و ترجیحات کاربران به آنها پیشنهاد میشود.
در بحث مدیریت ارتباط با مشتری هم، CRM تحلیلی یکی از حوزههایی است که کاربرد کلان داده در آن کاملاً مشخص است و مرور درس CRM تحلیلی میتواند در این زمینه کمی به شما دید بدهد.
اگر با بخش بندی بازار و بررسی رفتار مشتریان هم آشنا باشید، بیتردید میتوانید تصور کنید که تحلیل بیگ دیتا چقدر میتواند مفید باشد و در این زمینه به کمک تصمیمگیران بیاید.
اگر با بحث شخصی سازی (Personalization) هم آشنا باشید، میتوانید حدس بزنید که تحلیل دادهها در حجم بالا، چگونه میتواند به برنامه ریزی برای شخصی سازی خدمات کمک کند.
البته شخصی سازی خدمات، حتی بدون تحلیل کلان داده هم امکانپذیر است. اما وقتی گزینههای پیش روی شما زیاد و منابعتان محدود باشد، طبیعی است که شخصی سازی بر اساس تحلیل بیگ دیتا میتواند اثربخشترین گزینهها را (در مقایسه با هزینهی هر گزینه) برای شما تخمین زده و برآورد کند.
سیستم های توصیه گر (Recommendation Engines) هم از جمله کاربردهای کلان داده در کسب و کارهای دیجیتال هستند و استفاده از Big Data در این زمینه، نتایج محسوس و ملموسی به همراه داشته است.
یکی از حوزههایی که همواره در بحث بیگ دیتا مورد توجه بوده، حوزه پزشکی است. علل مختلفی را برای این مسئله میتوان ذکر کرد:
- اطلاعات عددی گسترده و متنوعی که میتوان از بیماران به دست آورد (در مقایسه با حوزههای کیفی)
- میل انسانها به همکاری در حوزهی سلامت (با این فرض که میتواند برایشان دستاوردهای مفید داشته باشد)
- اپلیکیشنها و ابزارهای متعددی که امروزه در حوزهی سلامت استفاده میشوند و دادههای فراوانی که تولید میکنند (فقط کافی است به سنسور شتابسنج موبایل خود فکر کنید که در بخش زیادی از روز، حرکتهای شما را ثبت میکند)
اما در بررسی کاربرد بیگ دیتا در پزشکی، مهم است که حوزههای مختلف را از یکدیگر تفکیک کنیم. مثلاً شاخهی پیش بینی از جمله حوزههایی است که امید نسبتاً بیشتری به آن وجود دارد و پیشرفتهای جالبتوجهی هم داشته است (شاید پروژهی Google Flu را بشناسید که هدف آن، پیشبینی آمار و روند شیوع آنفولانزا در نقاط مختلف، بر اساس میزان جستجوی کاربران بود).
شاخهی عارضهیابی و Diagnose، دومین حوزهای است که رشد محسوسی داشته است و امکان پردازش حجم زیاد تصاویری که از بیماران ثبت میشود، این امید را ایجاد کرده که بتوان در آینده فرصتهای ارزشمندی برای عارضهیابی خلق کرد.
حوزهی درمان و تصمیم گیریهای مربوط به آن، دشوارترین شاخه است و هنوز، باید زمان زیادی منتظر بمانیم تا دستاوردهای محسوس آن را مشاهده و تجربه کنیم.
اگر علاقهمند به مطالعهی بیشتر در زمینه کاربرد کلان داده در پزشکی و بهطور کلی حوزهی سلامت هستید، دو مقالهی زیر میتوانند نقطهی شروع مناسبی باشند:
Big Data Revolution in Healthcare (PDF)
Big Data Analytics in Healthcare (PDF)
فایل اول توسط مک کنزی تهیه شده و کمی عمومیتر است. فایل دوم، بیشتر از نظر منابعی که معرفی کرده مفید است. اغلب رفرنسهای معرفی شده، مطالب مفید و آموزنده و سادهای دارند. البته طبیعی است هر دو فایل با در نظر گرفتن مخاطب مبتدی معرفی کردهایم و اگر قصد داشته باشید به شکل تخصصی در این حوزه مطالعه کنید، باید به سراغ ژورنالهای تخصصی بروید.
سئو هم حوزهی دیگری است که به صورت گسترده از تحلیل Big Data استفاده کرده و نتایج آن را نیز همهی ما تجربه کردهایم.
در تاریخچه سئو اشاره کردیم که عبور از دوران تکیهی صِرف بر تحلیل کلمات کلیدی و رسیدن به الگوریتم های تحلیل رفتاری، باعث شده که روشهای سنتی سئوی کلاه سیاه دیگر به سادگی اثربخش نباشند. بخش مهمی از این دستاورد را باید به توانایی تحلیل رفتار کاربران در مقیاس گسترده نسبت داد.
این روزها اگر هم سایتها بتوانند با تکنیکهای سیاه، جایی در رتبههای برتر نتایج جستجو به دست بیاورند، موتورهای جستجو (خصوصاً گوگل) به سرعت پس از فرستادن بازدیدکنندگان به این صفحات و بررسی رفتار آنها، نامناسب بودن و کیفیت پایین این صفحات را ترجیح داده و نتایج خود را اصلاح میکنند.
طبیعتاً کاربرد کلان داده در حوزههای مختلف، بسیار فراتر از چند مورد محدودی است که در اینجا اشاره شد و در هر مورد، حتی کتابهای اختصاصی هم تألیف و منتشر شده است.
اما به طور کلی، باید به خاطر داشته باشید که Big Data هنوز بسیار جوان است و راهی بسیار طولانی در پیش است تا کاربردهای آن را به شکل تجاری و گسترده، در همهی زندگی خود ببینیم و تجربه کنیم.
سری مطالب حوزه سواد دیجیتالThe post کلان داده یا بیگ دیتا چیست؟ (+کاربردهای Big Data) appeared first on متمم.