sobhe-no.ir
993
سه شنبه، ۲۱ مرداد ۱۳۹۹
14
خبر

گزارش «صبح نو» درباره تحلیل فضای مجازی براساس اطلاعات

چگونه با شبکه‌های اجتماعی آینده را پیش‌بینی کنیم

یادداشت محسن فینی‌زادهتحلیلگر شبکه‌های اجتماعی / علم داده یک زمینه میان‌رشته‌‌ای است که از روش‌ها، فرایندها، الگوریتم‌ها و سیستم‌‌‌های علمی برای استخراج دانش و بینش از داده‌ها در اشکال گوناگون (ساختاریافته و ساختارنیافته) استفاده می‌‌کند. در حقیقت وظیفه اصلی علم داده، تبدیل اطلاعات و داده‌‌‌های خام به دانش قابل استفاده است.

صبح نو

گزارش «صبح نو» درباره تحلیل فضای مجازی براساس اطلاعات

چگونه با شبکه‌های اجتماعی آینده را پیش‌بینی کنیم

یادداشت محسن فینی‌زادهتحلیلگر شبکه‌های اجتماعی / علم داده یک زمینه میان‌رشته‌‌ای است که از روش‌ها، فرایندها، الگوریتم‌ها و سیستم‌‌‌های علمی برای استخراج دانش و بینش از داده‌ها در اشکال گوناگون (ساختاریافته و ساختارنیافته) استفاده می‌‌کند. در حقیقت وظیفه اصلی علم داده، تبدیل اطلاعات و داده‌‌‌های خام به دانش قابل استفاده است.

کاوش حجم بالایی از داده‌‌‌های ساختاریافته و ساختارنیافته به‌منظور شناسایی الگوهایی انجام می‌‌شود که می‌‌توانند به سازمان‌ها برای صرفه‌جویی در هزینه‌ها، افزایش کارایی، شناسایی فرصت‌‌‌های جدید در بازار و افزایش مزایای رقابتی کمک کنند. در علم داده، ریاضیات، آمار، علوم کامپیوتر و دیگر روش‌ها مانند یادگیری ماشین، کاوش داده و بصری‌‌‌سازی داده مورد استفاده قرار می‌‌گیرد.
در حال حاضر سازمان‌ها و کسب‌وکارها و بخشی از سیاست و مدیریت عمومی کشور بیش از هر زمان دیگری برای تصمیم‌گیری متکی به داده‌های جمع‌‌آوری‌شده در بانک‌های اطلاعاتی‌شان هستند. به همین خاطر نیاز به کسانی که توانایی سازماندهی، گرد‌آوری، تفسیر و استخراج الگوها و برآورد روندهای مختلف از داده‌ها را داشته باشند، محسوس‌تر از همیشه است. گرد‌آوری داده توسط کسب‌وکارها مساله‌ای است که در آینده با جدیت بیشتری ادامه خواهد یافت. این موضوع محدود به سازمان و 
کسب و‌کار نبوده و بدون شک به زودی علم داده در ابعاد علمی و اجتماعی و حتی اقتصاد و سیاست نیز رشد چشمگیری و بیش از پیشی در ایران و جهان خواهد داشت.
علم داده در حوزه‌‌‌های مختلف بر اساس کلان داده مورد بررسی کاربرد دارد؛ از علم داده در حوزه سلامت تا داده‌‌‌های سازمانی که حوزه مورد بحث ما کلان داده شبکه‌‌‌های اجتماعی است. به صورت کلی، علم داده بیشتر مواقع زمانی به کار می‌‌آید که یک کلان داده وجود داشته باشد که نیازمند آن باشیم که آن کلان داده را به مولفه‌ها و مفاهیم قابل درک تبدیل کنیم. به بیان بهتر بتوانیم چند میلیون داده را به یک جمله تبدیل کنیم که در تصمیم‌گیری‌ها به ما کمک کند.
 
سطوح داده‌کاوی
گستردگی داده‌کاوی سبب شده است تا بر اساس هدف و نیاز هر موضوع، سطوح مختلف تحلیل داده شکل بگیرد. در نگاه کلی این سطوح به چهار بخش اصلی تقسیم می‌‌شوند که عبارت هستند از توصیف، تشخیص، پیش‌بینی و تجویز.
 
توصیف
به اینکه «چه اتفاقی افتاده است؟» می‌‌پردازد؛ مثلا اینکه فلان اتفاق در فضای مجازی سبب شکل‌گیری یک موج یا ویژگی‌‌‌های مشخص در بستر شبکه‌‌‌های اجتماعی 
شده است. در سطح توصیف فقط به بیان اتفاق و تشریح رویدادها بدون بیان نظر کارشناسی می‌‌پردازیم. اینکه این موج یا موضوع چه تعداد محتوا دارد و این محتوا‌ها مطابق چه نمودار خط زمانی منتشر شده است یا کاربران اصلی و موثر فعال در آن موضوع چه کسانی بوده‌اند و... عناوینی هستند که در سطح توصیف به آن‌ها پرداخته می‌‌شود.
هرچند در نگاه اول این سطح بسیار ساده به نظر می‌‌رسد اما باید به این نکته اشاره کرد كه اولین گام در داده‌کاوی درست، انجام دادن همین سطح توصیف است؛ به بیان بهتر تا توصیف درستی از رخدادهای در حال اتفاق یا اتفاق‌افتاده نداشته باشیم، نمی‌توانیم تشخیص، پیش‌بینی یا تجویز درستی داشته باشیم. برای درک درست این سطح باید مقایسه‌‌ای بین داده‌کاوی در درمان بیماری انجام شود؛ همانگونه که تا پزشک توصیف درستی از بیماری و علائم آن نداشته باشد، نمی‌تواند تشخیص درستی بدهد و حتی تجویز کند، در داده‌کاوی هم تشخیص و دیگر مراحل آن مبتنی بر گام اول توصیف استوار شده‌اند.
 
تشخیص
در سطح بعدی، بعد از اینکه اتفاق توصیف شد، به چرایی اتفاق می‌‌پردازیم و سعی داریم بگوییم «چرا اتفاق رخ داده است؟» این سطح نسبت به سطح قبل پیچیدگی بیشتری دارد و سوال ما محدود به توضیح واقع در فضای مجازی نیست و باید چرایی رخداد را نیز بررسی کنیم. شاید شروع سطح جدی‌‌تر داده‌کاوی جایی باشد که کشور ما به تازگی در آن ورود کرده است و بیشتر گزارش‌ها و مقالاتی که در موضوع داده‌کاوی به چشم می‌‌خورد در سطح تشخیص است.
تحلیل اینکه یک موج در فضای مجازی به چه علتی و با چه شاخص‌هایی توانسته است توجه افکار عمومی کاربران را به خود جلب کند یا اینکه یک بحران مجازی با چه عواملی در حال رشد است به سطح تشخیص برمی‌‌گردد. تحلیل کمی و کیفی موج‌ها جدای از نمایش و توصیف آن در سطح تشخیص قرار می‌‌گیرد تا علت و چرایی رخداده‌‌‌های مجازی مشخص شود.
برای مثلا به صورت داده‌محور بررسی اینکه چه محتواهایی با چه ویژگی‌‌‌های و در چه شرایطی وایرال می‌‌شوند در این سطح قرار دارد. برای اینکه بتوانیم محتواهای مطلوب تولید کنیم در گام اول باید محتواهای مطلوب و محبوب را توصیف کنیم و به صورت کمی و کیفی به شرح آن‌ها بپردازیم. در گام دوم به تشخیص علل، ویژگی‌ها و سایر عواملی بپردازیم که سبب محبوب و مطلوب شدن این محتواها شده‌اند.
 
 پیش‌بینی
در سطح سوم داده‌کاوی باید بتوان بر اساس الگو‌‌‌های قبلی، داده‌‌‌های به‌روز و شناخت کارشناسی از جامعه و فضای مجازی، اتفاقات را پیش‌بینی کرد و به این سوال جواب داد که «چه چیزی اتفاق خواهد افتاد؟» مباحث افکارسنجی در انتخابات یا پیش‌بینی وضعیت بورس و... در این سطح قرار می‌‌گیرد.
عینی‌‌ترین مثال برای این سطح از داده‌کاوی، پیش‌بینی انتخابات است که در چند سال گذشته در کشور‌ها نتایج موفقی داشته است؛ در این سطح شما بر اساس توصیف و تشخیص روی داده‌ها به این نتیجه می‌‌رسید که کنش یک کاربر در فضای مجازی یا حقیقی چگونه خواهد بود.
در سطح مجازی می‌توان این مثال را برای مشخص‌‌ترشدن این سطح مطرح کرد که زمانی که هنوز یک موج شکل نگرفته است، با بررسی پارامترهای آغازین بتوان پیش‌بینی کرد این موج آیا شکل می‌گیرد یا نه و اگر در آینده شکل می‌گیرد، چه سطح و ویژگی‌‌‌های دارد یا فلان خبر بحرانی در مورد یک سازمان که در یک منبع مجازی منتشر شده است، آیا توجه افکار عمومی را به خود جلب می‌‌کند؟
در سطح حقیقی جدا از کنش‌های سیاسی می‌توان تمایل کاربران در فضای عمومی جامعه در موضوعاتی مانند خرید، بورس و... را نیز پیش‌بینی کرد. بررسی تمایل کاربران به انتشار عکس و محتوا از یک مدل گوشی خاص در بازه‌های مشخص را می‌توان نمایانگر میزان رضایت کاربران از آن گوشی دانست که سبب پیش‌بینی خرید احتمالی دیگران در آینده از آن مدل گوشی باشد یا نموداری که در حوزه اقتصاد و بورس مربوط به بیان میزان محتوا یا تحلیل احساسات کاربران در یک موضوع یا سهم خاص باشد را می‌‌توان یکی از ابزارهای کمک‌کننده برای پیش‌بینی بازار سهم یا اقتصاد در نظر گرفت چون بدون شک تمایل خرید یا فروش کاربران و کنش‌‌‌های آن بر این بازار‌ها موثر است.
 
تجویز
سخت‌‌ترین و پیچیده‌‌ترین سطح تحلیل داده است، به صورتی که برای یک تجویز درست در شبکه اجتماعی باید توصیف کاملی از فضا و تشخیص درست و پیش‌بینی دقیقی داشت. سوال اصلی تجویز می‌‌تواند این باشد که «چگونه وقایع آینده را مدیریت کنیم؟» مثلا چه اقداماتی برای بهبود تصویر یک سازمان یا فردا در فضای مجازی باید انجام داد.
اما آنچه به عنوان هدف نهایی داده‌کاوی در حال حاضر مطرح است، نه سطح توصیف است، نه تشخیص و حتی پیش‌بینی؛ آنچه مهم است این است كه چه کنیم و به بیان بهتر راهکار مدیریت آینده چگونه است؟ مثلا برای اینکه بتوانیم تجویز کنیم در زمان رخداد یک بحران خبری در مورد یک شخصیت یا سازمان باید چه کرد، لازم است ابتدا توصیفی از فضا شکل بگیرد، ریشه و ساختار آن تشخیص داده شود، بعد از آن مبتنی بر توصیف و تشخیص، فضای آینده پیش‌بینی شود و در نهایت تجویز رخ دهد که حالا سازمان یا شخص چه باید بکنند.
تجویز حوزه‌ای نزدیک به تولید محتوا دارد و در عین حال باید مبتنی بر ارزش‌ها و اصول هر سازمان و جامعه‌‌ای 
رخ دهد؛ همچنین باید کسی تجویز کند که جدا از شناخت نسبت به فضای مجازی، فهم دقیقی از فضای حقیقی جامعه نیز داشته باشد.
از بالا به پایین سطوح، ارزش تحلیل بالاتر خواهد رفت و در مقابل پیچیدگی‌های پیاده‌‌‌سازی هم بسیار بیشتر خواهد شد؛ هرچند با توجه به نیاز هر مجموعه باید داده‌کاوی متناسب با آن سطح استفاده شود و لزوما همه‌جا نیاز به پیش‌بینی یا تجویز نیست و در بعضی موارد توصیف کفایت می‌‌کند.
 

captcha
شماره‌های پیشین