مدیریت اکوسیستم داده

یک سیستم شامل مجموعه ای از اجزای وابسته به هم می­باشد که در راستای هدفی واحد با یکدیگر تعامل دارند و اکوسیستم (زیست بوم) به محیطی که یک یا چند سیستم در آن قرار دارد گفته می­شود. شرط لازم برای بقای اکوسیستم معمولا وجود نیاز پایدار بین اجزای مختلف آن می­باشد. همانطور که شرط لازم برای شکل گیری یک اکوسیستم طبیعی معمولا وجود عناصر پایه نظیر آب و هوا است، شرط لازم برای شکل گیری یک اکوسیستم دیجیتال داده-محور وجود “داده و اطلاعات” است. داده­ها در یک اکوسیستم داده توسط برخی از سامانه­ های الکترونیکی یا هوشمند تولید می­شوند و توسط برخی دیگر از سامانه ها مصرف می­شوند که در نهایت منجر به شکل گیری زنجیره ای از روابط داده-محور می­گردد. در چنین زنجیره­ هایی، داده­ ها از مبادی گوناگون تامین شده و پس از طی فرآیندهای مختلف در چرخه حیات خود، به شکل­ های متنوعی مورد استفاده قرار میگیرند و ارزش­های متفاوتی را خلق می­کنند. محیط­ هایی نظیر وب، پرتال­های داده باز، شبکه­ های اجتماعی، ویکی ­ها، وبلاگ­ها و سکوهای کسب­ و کار سرویس­ گرا شامل منابع غنی داده و اطلاعات هستند که موجب شکل گیری سامانه­ های داده­-محور متنوع شده اند.

نشست ۶۴ گروه علم اطلاعات در حسینیه ارشاد که روز شنبه ۱۳ آّبان ۹۶ برگزار شد به موضوع مدیریت اکوسیستم داده اختصاص داده شده بود و بنده نیز افتخار این رو داشتم که در جمع اساتید، دوستان و علاقه مندان به این موضوع ارائه ای داشته باشم. چکیده ای از ارائه به همراه اسلایدها در ادامه در دسترس است.

data_ecosystem_02

چالش جدی که در اکوسیستم­های داده با آن مواجه می­شویم، بررسی اصالت منبع داده توسط مصرف کننده پس از گذار از واسطه­ های پردازشی و تحلیلی مختلف است که در ادبیات موضوع به آن Data Provenance گفته می­شود. وقتی قرار باشد مصرف کننده بر روی داده­ هایی که جمع آوری می­کند ارزش افزوده بیشتری ایجاد کند و مجدد بصورت خدمت یا کاربردی جدید ارائه کند اهمیت اصالت منابع داده بیشتر می­شود. افزایش ابعاد کلان­ داده ها سبب شده است که مرز بین داده معتبر و نامعتبر به سختی قابل تفکیک باشد که در نهایت سبب افزایش پیچیدگی توسعه خدمات و سامانه­ های کاربردی برای یکپارچه­ سازی داده­ ها، پیش پردازش، و یا کشف ناهنجاری­ ها می­شود. در سال ۲۰۱۳ کنسرسیوم جهانی وب استانداردهایی را جهت ایجاد مدل­های توصیف اصالت داده به کمک فراداده و هستان شناسی در سطح وب ارائه کرد؛ اما این استانداردها قادر به مواجه با چالش­های پیش رو در کلان­ داده ­ها نبوده و به همین دلیل موضوع اصالت داده مجددا مورد توجه سازمان­ های استانداردسازی نظیر ISO/IEC و ITU قرار گرفته است و به دنبال راهکارهای جدیدی برای حل این چالش هستند. برای مواجه شدن با هر چالشی لازم است ابتدا ابعاد مختلف آن مورد تجزیه و تحلیل قرار بگیرد، زیرا اگر مساله به خوبی شناخته شود فاصله زیادی تا حل آن باقی نخواهد ماند؛ امید است که فضای گفتمان فراهم شده در این نشست هم اندیشی در راستای شناخت ابعاد مختلف این موضوع در اکوسیستم ­های داده به نحو مقتضی مورد بهره برداری حاضرین قرار گرفته باشد.

جهت دریافت اسلایدهای ارائه شده میتوانید از طریق این پیونداقدام نمایید.

 

 

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *