ناظر اقتصاد: در گزارش پیش رو، به بررسی مفهوم کلان داده خوهیم پرداخت، همچنین حجم بازار و روند آتی متصور برای کلان دادهها را مورد بررسی قرار خواهیم داد.
امروزه فناوری اطلاعات در مرکز توجه علوم مدرن و کسبوکار است. این فناوری از تراکنشهای برخط، رایانامهها، ویدیوها، صدا، تصاویر، جریانهای کلیک، گزارش خطاها، پستها، گزارشهای جستجو، رکوردهای اطلاعات سلامت، عملیات متقابل در شبکههای اجتماعی، دادههای علمی، حسگرها، تلفنهای همراه و نرمافزارهای روی تلفنهای همراه تولید میشوند.
پایگاه دادههای حاوی این دادهها به سرعت رشد میکنند و نظارت، فرم دهی، ذخیره، مدیریت، اشتراکگذاری، آنالیز و مجازیسازی آنها از طریق ابزارهای نرمافزاری معمول دشوار است. یکی از چالشهای مهم محققین این است که با رشد سریع کلان دادهها، نیاز به طراحی سکوهای رایانش ابری مناسب جهت آنالیز و بروز رسانی داده بهسرعت افزایش مییابد.
با رشد سریع فناوری اطلاعات در برنامههای کاربردی نوظهور مانند تحلیل شبکههای اجتماعی، تحلیل وب منظم و تحلیل شبکه زیستی و غیره مجموعه متنوعی از دادهها جهت پردازش پیوسته با سرعت بسیار بالا موردنیاز است. مدیریت مؤثر و تحلیل مقیاس بزرگ داده جذابیتهایی را در این حوزه ارائه میکند اما با چالشهای حیاتی نیز مواجه است. کلان دادهها یکی از طلایهداران حال حاضر و آینده تحقیقاتی در دنیا است که حوزههای بسیاری نظیر تحقیقات علمی، مدیریت دولتی، صنایع، سازمانها و بنگاهها را متحول خواهد کرد.
مؤسسه تحقیقاتی گارتنر کلان داده را در میان ده روند فناوری برتر دنیا در سال ۲۰۱۳ و همچنین در میان ده روند فناوری حیاتی در پنج سال آینده معرفی کرده است. تغییرات سریع فناوری در دنیای پرتکاپوی حوزه فناوری اطلاعات و ارتباطات دولتها را وادار کرده است تا راهبردهای خود را همگام با تکامل فناوریها در دنیا از نو تعریف کنند یا حداقل همگام با دنیا جهتگیریهای خود را برای مهاجرت به سمت فنّاوریهای جدید و استفاده از آنها اصلاح کنند.
نظر به شکلگیری موج توجه ویژه به موضوع دادههای کلان در کشورهای دنیا و با عنایت به گزارشهای گروههای مطالعاتی نظیر گارتنر و با توجه به مورد توجه قرار گرفتن این حوزه در ژورنالهای معتبر و همچنین در اجلاسهای معتبری نظیر TDWI 2014 و INFORMS، توجه ویژه به این حوزه و رصد تغییرات آن در کشور را به امری الزامی بدل کرده است.
در دو دهه گذشته، رشد پیوسته توان محاسباتی سبب رشد جریان فزایندهای از داده شده است. داده عظیم نه تنها دسترسی آن بیشتر شده است، بلکه برای رایانهها قابلفهمتر نیز شدهاند. بهعنوانمثال، آزمایشهای فیزیکی با انرژی بالای جدید بهطورکلی بیشتر از یک ترابایت داده در هر روز تولید میکند. محیط وب شبکه اجتماعی مشهور فیسبوک، در شرایط عادی دارای ۵۷۰ میلیون بازدید در هر ماه بوده و در همین مدت سه میلیارد تصویر جدید را در خود ذخیرهسازی کرده و ۲۵ میلیارد صفحه جدید از اطلاعات را در خود میگنجاند.
اخیراً، دادههای کلان توجه تعداد زیادی از دانشگاهیان، صنایع و همچنین دولتیها را به خود منعطف کرده است. رشد روزافزون حجم داده و ایجاد دادههای عظیم از طریق رایانش ابری در سالهای اخیر در بسیاری از کاربردها دیده شده است. دادههای کلان چالش مهمی است که احتیاج به زیرساختی قوی برای اطمینان از انجام موفق پردازشها و آنالیزهای موردنیاز دارد. موضوع حائز اهمیت این است که چگونه میتوان از زیرساخت رایانش ابری برای دسترسی، پردازش و آنالیز دادههای کلان استفاده کرد.
رشد انفجاری در حجم، سرعت و تنوع دادههای تولیدشده توسط دستگاههای ارتباطی همراه و برنامههای کاربردی ابری در ازدیاد دادههای عظیم نقش داشته است. راهحلهای موجود برای ذخیرهسازی کارآمد دادهها و مدیریت آنها نمیتوانند نیازهای چنین دادههای ناهمگنی که مقدار دادهها بهطور مداوم در حال افزایش هستند را برآورد سازند. با توجه بهسرعت در حال رشد اندازه شاخصها و زمان جستجو، راهحلهای موجود برای مدیریت و بازیابی مؤثر دادهها ناکارآمد میشوند.
مفهوم کلان داده عبارت کلان داده(Big Data) مدتها است که برای اشاره به حجمهای عظیمی از دادهها که توسط سازمانهای بزرگی مانند گوگل یا ناسا ذخیره و تحلیل میشوند مورد استفاده قرار میگیرد؛ اما به تازگی، این عبارت بیشتر برای اشاره به مجموعه دادههای بزرگی گفته میشود که بهقدری بزرگ و حجیم هستند که با ابزارهای مدیریتی و پایگاههای داده سنتی و معمولی قابل مدیریت نیستند. مشکلات اصلی در کار با این نوع دادهها مربوط به برداشت و جمعآوری، ذخیرهسازی، جستوجو، اشتراکگذاری، تحلیل و نمایش آنها است.
این مبحث، به این دلیل هر روز جذابیت و مقبولیت بیشتری پیدا میکند که با استفاده از تحلیل حجمهای بیشتری از دادهها، میتوان تحلیلهای بهتر و پیشرفتهتری را برای مقاصد مختلف، از جمله مقاصد تجاری، پزشکی و امنیتی، انجام داد و نتایج مناسبتری را دریافت کرد.
بیشتر تحلیلهای مورد نیاز در پردازش دادههای عظیم، توسط دانشمندان در علومی مانند هواشناسی، ژنتیک، شبیهسازیهای پیچیده فیزیک، تحقیقات زیستشناسی و محیطی، جستوجوی اینترنت، تحلیلهای اقتصادی و مالی و تجاری مورد استفاده قرار میگیرد. حجم دادههای ذخیرهشده در مجموعههای دادهای Big Data ، عموماً به خاطر تولید و جمعآوری دادهها از مجموعه بزرگی از تجهیزات و ابزارهای مختلف مانند گوشیهای موبایل، حسگرهای محیطی، لاگ نرمافزارهای مختلف، دوربینها، میکروفونها، دستگاههای تشخیص RFID، شبکههای حسگر بیسیم و غیره با سرعت خیرهکنندهای در حال افزایش است.
روندهای کلان داده تحلیل بازار کلان دادهها نشان دهنده این حقیقت است که حجم بازار کلان داده تا سال ۲۰۲۷ به ۱۰۳ میلیارد دلار خواهد رسید.
نمودار ۱: حجم بازار کلان دادهها در افق ۲۰۲۷ (میلیارد دلار) طبق پیشبینیهای صورت گرفته، تا اواخر سال ۲۰۱۹ حجم بازار کلان داده حدود ۲۰ درصد رشد خواهد داشت. در سال ۲۰۲۰ هر فردی حدود ۱.۷ مگابایت در عرض فقط یک ثانیه تولید خواهد نمود. کاربران اینترنت حدود ۲.۵ کوانتیلیون(quintillion) بایت داده در هر روز تولید خواهد نمود. تا سال ۲۰۲۵ حدود ۹۷.۲ درصد سازمانها در کلان دادهها و هوش مصنوعی سرمایهگذرای خواهند کرد. بررسی روندها حکایت از این دارد که کلان دادهها منجر به تغییراتی اساسی در کسب و کار اصلی صنایعی مانند انرژی، سیستم بهداشت، خدمات بهداشت و خدمات حرفهای شده است.
شکل ۱: تغییر در کسب و کار اصلی صنایع به واسطه کلان داده کاربردهای مهم کلان دادهها یکی از روندهای جاری در حوزه پایش جامعه اطلاعاتی و بررسی میزان دستیابی به اهداف توسعه ملی و بینالمللی، بهرهگیری از دادههای عظیم به عنوان منبعی مکمل برای آمارها و دادههای فناوری اطلاعات است. نقش کلان دادههای عظیم در پایش جامعه اطلاعاتی فناوری اطلاعات و ارتباطات عبارتاند از:
بهرهگیری از دادههای کلان به عنوان منبعی مکمل برای آمارهای فاوا؛ مقرون بهصرفه بودن خدمات فناوری اطلاعات و ارتباطات؛ مهارتهای فناوری اطلاعات و ارتباطات؛ اثرات فناوری اطلاعات و ارتباطات؛ اشتغال در بخش فناوری اطلاعات و ارتباطات؛ شاخص جهانی آمادگی امنیت سایبری (GCI)؛ بانکداری سیار؛ استفاده از فناوری اطلاعات و ارتباطات در کسبوکارها محیطزیست و فناوری اطلاعات و ارتباطات کاربرد دادههای کلان در شرکتها، میتواند بهرهوری تولید و رقابتپذیری را از جنبههای بسیاری بالا ببرد. به طور خاص، در بازاریابی، با تحلیل دادههای بزرگ، شرکتها میتوانند با دقت بیشتری رفتار مشتری را پیشبینی نمایند و شرایط همکاری بهتری را در تجارت پیدا کنند.
شرکتها میتوانند در برنامهریزی و معرفی طرحهای فروش، بعد از مقایسه دادههای حجیم، قیمت کالاهای خودشان را بهینه سازند تا کارآمدی، بهرهوری و رضایت بخشی تجاری، بهینهسازی نیروی کار، پیشبینی درست و دقیق تخصیص الزامهای پرسنلی، پرهیز و دوری از ظرفیت تولید اضافی و کاهش هزینه انجام کار را بهبود بخشند. همچنین، این شرکتها میتوانند در زنجیره تأمین نیازهای اساسی خود را با استفاده از داده های بزرگ، بهینه سازی موجودی انبار و نیازهای ضروری خویش را برای کاهش توقف بین تأمین و تقاضا، کنترل بودجه و بهبود خدمات اداره کنند.
از دیگر کاربردهای دادههای بزرگ، تولید محصولات نرم افزاری هوشمند است که بر اساس دادههای موجود یا اطلاعات دریافت شده از تعامل با کاربران سامان مییابد؛ برای مثال، وقتی یک محقق علوم اسلامی در جستجوی موضوعی خاص است، دادههای بزرگ در این زمینه او را در دستیابی به مطالب منسجم، جامع و دقیق یاری میرسانند و همه منابع و محتواهای معتبر، میان رشتهای و مرتبط با موضوع را در اختیار او قرار خواهد داد.
کاربرد دادههای کلان مبتنی در اینترنت اشیاء (IoT) برای مثال، کامیونهای UPS به حسگرها ، آداپتورهای بیسیم و GPS مجهز هستند که دفتر مرکزی میتواند موقعیتهای کامیون را دنبال کند و از خرابی موتور یا مشکلات احتمالی در طول مسیر جلوگیری نماید. در همین حال، این سیستم به UPS کمک میکند که کارمندانش را نیز مدیریت و نظارت کند و مسیرهای تحویل را بهینه سازد. مسیرهای تحویل بهینه که مختص به کامیونهای UPS است، از سابقه تجربه رانندگی آنها استخراج شده است.
همچنین، شهر هوشمند، یک محدوده پژوهشی بر اساس کاربرد دادههای IoT می باشد؛ برای مثال، همکاری پروژه شهر هوشمند بین Miami-Dade در فلوریدا و IBM نزدیک به ۳۵ نوع دپارتمان دولتی را در آنها به هم متصل میکند و در نتیجه، دولت، میتواند اطلاعات بهتری برای پشتیبانی و تصمیمگیری برای مدیریت منابع آبی، کنترل ترافیک و بهبود امنیت عمومی به دست آورد.
کاربرد دادههای کلان در شبکههای اجتماعی SNS آنلاین، یک ساختار اجتماعی تشکیل شده از افراد اجتماعی و اتصالات میان افراد بر اساس یک شبکه اطلاعاتی است. کلان دادههای SNS آنلاین، از پیامهای فوری و آنلاین، میکروبلاگ و یا فضای اشتراک میباشد که فعالیتهای مختلف کاربر را اداره میکند. تحلیلهای دادههای بزرگ در SNS آنلاین، روش تحلیلی محاسباتی ارائه شده را برای فهم روابط جامعه انسانی توسط نظریات و روشها بیان مینماید که شامل: ریاضیات، انفورماتیک، جامعه شناسی و یا علم مدیریت است و از آنها در سه بُعد: ساختار شبکه، تعامل گروهی و گسترش اطلاعات استفاده میکند.
این برنامه، شامل تواناییهایی همچون: تحلیل هوش شبکهای، بازاریابی اجتماعی، پشتیبانی تصمیمگیریهای دولتی و تحصیل آنلاین می باشد.
امنیت کلان دادهها نگران کنندهترین مسئله دوران کنونی، حریم خصوصی و امنیت اطلاعات میباشد. از آنجا که حریم خصوصی برای فرد و انواع دادههای سازمانی بسیار ضروری است، تبدیل به یک چالش عمده برای کلان دادهها شده است. جلوگیری از نشت دادهها در هنگام پردازش و دفاع از حملات بیرونی، نیازمند نوعی مدل امنیت داده محور قابل اعتماد است. این فناوری، همچنین باید از تهدیدات امنیتی که ممکن است در هنگام ذخیرهسازی چنین دادههای بزرگی رخ میدهد، مراقبت کند.
در عصر دادههای بزرگ، همانطور که حجم دادهها به سرعت رشد میکند، خطرات امنیتی شدیدتری وجود دارد؛ در حالی که ثابت شده روشهای حفاظت دادههای سنّتی، برای دادههای بزرگ کارآمد نیستند؛ به خصوص حریم خصوصی دادههای بزرگ که با چالشهای امنیتی زیر مواجه میشود:
حفاظت از حریم خصوصی حین کسب داده: علایق و ویژگیهای شخصی و عادات کاربران میتواند به راحتی کسب شود و کاربران متوجه نخواهند شد. دادههای حریم خصوصی میتوانند حین ذخیره سازی، انتقال و استفاده، نشتی پیدا کنند؛ حتی اگر با تأیید کاربران به دست آید. از این رو، میتوان نتیجه گرفت که حریم خصوصی کلان دادهها میتواند به وسیله دو رویکرد مختلف حفظ شود: یکی، تحمیل قوانین به فرد و سازمان، و روش دیگر، توسعه حریم خصوصی. بنابراین، دادههای بزرگ، چالشهایی برای رمزگذاری دادههای با مقیاس بزرگ و تراکم بالا به ارمغان میآورد. عملکرد روشهای رمزگذاری در دادههای کوچک و متوسط، نمیتواند تقاضای دادههای بزرگ را برآورده کند؛ چرا که باید روشهای رمزنگاری دادههای بزرگ کارآمد شود و توسعه یابد. ازاین رو، در این خصوص باید طرحهای مؤثر مدیریت امنیت، کنترل دسترسی و ارتباطات امن برای دادههای ساخت یافته، نیمه ساخت یافته و غیرساخت یافته مورد بررسی و تحقیق قرار گیرد.
جمعبندی در این گزارش به بررسی مفهوم کلان داده پرداخته شد و مهمترین کاربردهای آن را مورد بررسی قرار گرفت. مطالعه روند کلان داده حکایت از این دارد که حجم بازار کلان دادهها از ۴۹ میلیارد دلار در سال ۲۰۱۹ به بیش از ۱۰۳ میلیارد دلار در سال ۲۰۲۷ خواهد رسید. همچنین ساختار کسب و کارها با ظهور کلان دادهها متحول شده و خواهد شد.
بهرهگیری از دادههای کلان بهعنوان منبعی مکمل برای آمارهای فاوا؛ مقرونبهصرفه بودن خدمات فناوری اطلاعات و ارتباطات؛ مهارتهای فناوری اطلاعات و ارتباطات؛ اثرات فناوری اطلاعات و ارتباطات؛ اشتغال در بخش فناوری اطلاعات و ارتباطات؛ و شاخص جهانی آمادگی امنیت سایبری (GCI) از جمله مهمترین زمینههایی است که کلان دادهها در آن کاربرد دارند.
کلان داده بسیاری از صنایع و حتی زندگی ما را هم تحت تاثیر قرار میدهد؛ اما این مسئله خطرناک است یا مفید؟ در ادامه به بررسی کلان داده، اهمیت و خطرات آن میپردازیم.
داده شامل اطلاعات است؛ اما این همهی ماجرا نیست. جزئیات یک حادثه یا اخباری دربارهی سلامت انسان دادهای نیست که ما با آن سروکار داشته باشیم. وقتی ما از داده صحبت میکنیم درواقع منظورمان مجموعهی داده، سازماندهی و ذخیرهسازی آن است.
در عصر اینترنت شرکتها و سازمانها در سراسر جهان دادههای بسیاری جمعآوری کردهاند که در ادامه به مقیاس گستردهی آنها میپردازیم. اکنون که کلان داده وجود دارد تاثیر بسیار بزرگی بر زندگی ما میگذارد.
کلان داده چیست؟ کلان داده مجموعهی بسیار بزرگی از دادهها است که ابزارهای سنتی ما برای مدیریت این اطلاعات به کار نمیآیند. کلان داده میتواند اشکال مختلفی داشته باشد.
نمونههایی از کلان داده: توییتهای ذخیرهشده در سرورهای توییتر اطلاعاتی که گوگل از ردیابی خودروهای سواری بهدست میآورد مجموعهای کامل از نتایج انتخابات محلی و ملی کشور که ابتداییترین رکوردها را نیز در بر دارد اطلاعات شرکتهای بیمه درمانی دربارهی افرادی که تحت درمان قرار میگیرند، نوع معالجات آنها و بیمارستان مورد نظر دارند اطلاعات لیست خریدها و مکانهای ثبت شده در کارتهای اعتباری اطلاعات زمان، مکان و مدت زمان فیلمهایی که افراد در نتفلیکس تماشا میکنند فناوری کلان داده چیست؟ رایانههای شخصی ما بطور کلی توانایی مدیریت حجم کمی از دادهها را دارند. کل اطلاعاتی را که میتوانید وارد یک کامپیوتر کنید، در نظر بگیرید؛ در عین حال نرمافزارهای پایگاهداده قابلیت مدیریت حجمهای بزرگتری از اطلاعات را دارند. این ابزارها میتوانند روی دادههای یک درایو سخت قرار بگیرند؛ البته ممکن است به قفسههایی شامل نوتبوکها و پوشهها نیاز داشته باشند. اما این ابزارها برای رسیدگی به کل حجم اطلاعاتی که ما بهعنوان کلان داده به آنها اشاره میکنیم کافی نیستند. به همین خاطر روشهای جدیدی توسعه یافتهاند.
محاسبات ابری کارها را از کامپیوترهای ما روی سرورهای راه دور تخلیه میکند. به همین دلیل روشهای زیادی برای دسترسی و استفاده از اطلاعات وجود دارد.
کاربردهای جالب توجه کلان داده کلان داده به خودیِ خود به وجود نیامده؛ چندین روند، علت وجود آن را تقویت کردهاند.
اینترنت اشیاء
اینترنتی که شما در حال حاضر میشناسید اینترنت افراد است، جایی که در آن مردم از طریق ماشینهایی تسهیلکننده با یکدیگر ارتباط برقرار میکنند. به عنوان نمونهای از این تعاملات، تصور کنید شما سایتی که دیگران طراحی کردهاند را بازدید میکنید و یا متنی که دیگران در سایت تایپ کردهاند میخوانید. اینترنت اشیاء جایی است که در آن اشیاء بدون دخالت بشر مستقیما با یکدیگر ارتباط برقرار میکنند؛ مثلا یک دستگاهی که بر آبوهوا نظارت میکند در نظر بگیرید؛ ترموستاتی هوشمند به این اطلاعات دسترسی پیدا میکند و درجه حرارت منزل شما را تنظیم میکند. کلان داده و اینترنت اشیاء کاملا به یکدیگر وابستهاند. سازمانها باید بدانند با حجم انبوهی از اطلاعاتی که جمعآوری میشود، چهکاری باید انجام دهند. اشیاء از طریق اینترنت و به لطف دادههایی که در دسترسشان است میتوانند خودشان اقداماتی را صورت بدهند. هرچه دستگاههای بیشتری به این روش عمل میکنند دادههای بیشتری تولید میشود.
یادگیری ماشین منظور از یادگیری ماشین در واقع توانایی یادگیری کامپیوتر بر مبنای دادهها است؛ همین توانایی اساس شکلگیری وضعیتهای مختلف رادیو اینترنتی پاندورا به سَبک مخصوص شما است. همچنین یادگیری ماشین در پشت پردهی پیشنهادات محتوای یوتیوب و نتفلیکس قرار دارد.
این پیشبینیها مبتنی بر الگوریتمها هستند. الگوریتم جستجوی گوگل و نیز الگوریتمی که تعیین میکند چه چیزی در فید خبری فیسبوک مشاهده کردهاید همگی مبتنی بر توانایی یادگیری ماشین هستند.
اما اینها بخش کوچکی از چگونگی تاثیر یادگیری ماشین بر زندگی روزمرهی ما هستند.
هوش مصنوعی هوش مصنوعی گام بعدی پس از یادگیری ماشین است. در هوش مصنوعی نه تنها یادگیری کامپیوتر باز دادهها وجود دارد، بلکه کامپیوتر از این اطلاعات در راستای تصمیمگیری متکی به خود و شکلدهی رفتار خودش استفاده میکند. مایکروسافت و گوگل نمونههایی از تلاش برای ساخت رباتهای انسانی هستند؛ فیسبوک نیز هوش مصنوعی را برای کمک به جلوگیری از خودکشی به کار گرفته است. فناوری به سرعت در حال پیشرفت است، تا جایی که نمونههای متعددی وجود دارد که “تفکر کردنِ کامپیوتر” بهتر از نوع بشریِ آن عمل میکند.
علم تجزیه و تحلیل کلان داده چیست؟ منابع کلان داده به خودی خود هیچگونه اطلاعاتی را در اختیار ما نمیگذارند، در واقع شخصی باید باشد که مفهوم این اطلاعات را دریابد. در واقع کل کاری که در تجزیه و تحلیل کلان داده باید انجام شود به این صورت است: بررسی حجم زیادی از اطلاعات غیر قابل فهم و سپس فهمیدن آنچه میتوان از آن استخراج کرد.
شرکتها در زمینههای مختلف برای ارائه روشهای تحلیل مخصوص خودشان در حوزه کلان دادهها با یکدیگر رقابت میکنند
و به همین ترتیب کلان دادهها روی زندگی شما تاثیر میگذارند، حتی اگر یک مخالف تکنولوژی دنیای مدرن باشید. اما چرا به کلان دادهها روی آوردهایم؟ به این علت که با بینش صحیح، کلان دادهها مزایای زیادی دارند.
کاربردهای کلان داده کلان داده همواره در جهت بهبود روند زندگی کاربرد زیادی داشته است؛ در این بخش برخی از موارد کاربرد کلان داده را بررسی خواهیم کرد:
کلان داده در خدمات بهداشتی، درمانی و سلامت صنعت بیمه سلامت در زمینه اقتباس تکنولوژیهای جدید سرعت خوبی ندارد. برخی از ارائهدهندگان بیمههای بهداشتی، درمانی و سلامت در حال مهاجرت از کاغذ به ابزارهای ذخیرهسازی دیجیتالی هستند. با این وجود کلان داده در برخی زمینهها تفاوتهایی را ایجاد کرده است؛ یکی از این زمینهها یکپارچگی دادهها است. بیمهگذاران و ارائهدهندگان در حال کار روی ترکیب دادههای منابع مختلف هستند، دادههایی مانند مانند مطالبات، اشعه ایکس، یادداشتها و نسخههای پزشکان.
بسیاری معتقدند که اگر دادههای بیمه سلامت بهتر یکپارچهسازی میشدند میتوانستند بیمهی بهتری با هزینهای کمتر ارائه بدهند. در حالی که آمازون، برکشایر هاتاوی و جان پیرپونت مورگان اوایل سال جاری اعلام کردند در زمینه بیمه سلامت با یکدیگر همکاری میکنند، تکنولوژی را به عنوان نقطه تمرکز خود (مانند صفحه اصلی روزنامه گاردیَن) اعلام کردند.
کلان داده در بانکداری و خدمات مالی صنعت مالی کاملا مصرّ بر تصمیمگیریهای مبتنی بر تحلیلهای کامپیوتری است. سقوط آنی سهام وال استریت به علت معاملات خودکار از طریق ماشینهایی بود که بدون دخالت انسان سهام را به سرعت با قیمتی پایینتر میفروختند و با توجه به آنچه در بازار درحال رخ دادن بود سایر فروشندگان را وادار به فروش کرده و نسبت به فروش تحریک میکردند. این نوع تجارت، تجارت بسامد بالا نامیده میشود.
اکنون دانشمندانِ دادههای مالی، با استفاده از کلان دادهها پیشبینی میکنند که کدام سهام موفق خواهد بود و کدام یک احتمال دارد سقوط کند. همچنین بانکها هم به کلان دادهها به عنوان راهی برای افزایش درآمد نگاه میکنند.
کلان داده در تجارت الکترونیکی و بازاریابی بازاریابی مدرن به دادهها وابستگی شدیدی دارد و ما هم با هر خریدی که انجام میدهیم اطلاعات زیادی تولید میکنیم. در این رابطه کلان داده وعدههای بسیاری به حوزهی بازاریابی داده است که اصلی ترین آنها پاسخ به دو نیاز اصلی است.
اول به کمک آنها میتوان درباره شخص خریدار، زمان، مکان، نوع و قیمت خرید اطلاعات کسب کرد؛ و مورد دوم به دست آوردن ارتباطی منطقی بین محصولاتی که مشتریان میبینند یا در موردشان میخوانند یا میشنوند و در نهایت چیزی که خریداری میکنند. برخی فروشگاهها با ردیابی کارتهای اعتباری و وفاداری مشتریان از طریق دوربین یا ردیابی تلفنشان میفهمند کدام بخش از فروشگاه بیشتر توجه آنها را جلب کرده است. مشتریان قبل از خرید باید به صورت آنلاین حسابهایی ایجاد کنند که این کار به سایتها اجازه میدهد نه تنها خریدهای آنها بلکه هر قلمی که آنها مشاهده میکنند را نیز ردیابی کنند.
در عوض تکنیکهایی مثل هدفگیری و شناسایی مشتری که نیمی از بودجهی بازاریابی را هدر میدهند و تنها برای کوتاهمدت اثربخش هستند، پاسخ به این دو نیاز بسیار اثربخشتر است.
برای پاسخ به این نیازها، بازاریابها باید با استفاده از کلان داده از طریق تشخیص الگوی مصرف مشتری و شناخت علاقمندیها و عادات مصرف، خرید بعدی وی را پیشبینی کنند
در واقع فروشگاهها طرحهای خود را بر مبنای علاقه و رفتار مشتریان پایهگذاری میکنند تا شرایط همکاری بهتری را در تجارت پیدا کنند. فروشندگان آنلاین بر مبنای اطلاعات جمعیتشناختی و سایر معیارها دربارهی چیزی که ما میخواهیم ببینیم تصمیم میگیرند. فروشگاههای جدید غیر مجازی آمازون نمونهای از ادغام دو دنیا هستند.
نیازهای بزرگی وجود دارند که از طریق نظارت بر علایق و رفتار آنلاین ما بوجود میآیند. گوگل و فیسبوک غولهای سودآور تکنولوژی هستند که دلیل آن توانایی آنها در فروش تبلیغات است که نسبت به پلتفرمها و روشهای تبلیغاتی دیگر بهتر میتوانند گروه مصرفکنندگان به خصوص را مورد هدف قرار بدهند؛ این قابلیت آنها به لطف اطلاعاتی است که برای استفاده از سرویسهای آنها ارائه میکنیم.
آیا کلان داده خطرناک است؟ همانطور که کلان داده با وعدههایی همراه است ریسکهایی نیز دارد؛
نگرانکنندهترین مسئله حال حاضر، حریم خصوصی و امنیت اطلاعات است
کاهش حریم خصوصی از جمله معایب بزرگ کلان داده است؛ اکثریت مردم بیشتر از هر زمان دیگری در تاریخچهی بشری دربارهی ما اطلاعات دارند. نه تنها پیدا کردن محل زندگی ما، بلکه دانستن در مورد جایی که میرویم، شخصی را که دوست داریم، نحوهی زندگی ما، و تفکرات ما نیز آسان است. این موضوع باعث میشود که مسائل شخصی و اجتماعی بیشتر در معرض دستکاری قرار بگیرند. ممکن است ما فریب بخوریم و رمز و شماره کارت اعتباری خود را از دست بدهیم یا تحت تاثیر قرار بگیریم تا به کاندیداهایی رای بدهیم که تمایلی به حمایت از آنها نداریم. دادههای بیشتر راههای بیشتری برای تبلیغکنندگان و شرکتهای رسانهای فراهم میکند تا میلها و ارزشهای ما را شکل دهند. نسبت به گذشته اطلاعات و دادههای بیشتری دربارهی ما وجود دارد و این دادهها در مکانهای بیشتری نگهداری میشوند و این مسئله باعث میشود اهداف بیشتری در معرض حمله قرار بگیرند. در حال حاضر سرقت دادههای ما به صورت غیر قابل کنترل و بی وقفه رخ میدهد. حتی شرکتهایی که روند درستی برای حفاظت از دادههای ما در مقابل حملات خارجی دارند اغلب خودشان فعالیتهای مشکوکی روی دادههای ما انجام میدهند، همانند چیزی که در فیسبوک شاهد بودیم. مسئلهی ریسک بعدی پیشبینیهایی است که افراد از طریق اطلاعات کلان داده انجام میدهند. مثلا آیا برای بیمهی سلامتی افرادی که عادتهای غذایی ناسالم دارند بیشتر هزینه کنیم؟ آیا باید امنیت و ارامش را در مناطقی که پیشبینی میکنیم افزایش بدهیم؟ آیا قیمت برای خریداران آنلاین که در مناطق فقیر زندگی میکنند افزایش مییابد؟
یافتن راههایی برای حفاظت از داده، احترام به حریم خصوصی و حفظ ارزشهایمان به صورت چالشهایی مداوم با روندی در جهت کلان دادهها ادامه خواهد داشت.