Data Warehouse Creation based on a Fuzzy Multi-Criteria Decision Making Approach

Authors

1 Dept. of Electrical, Computer and IT Engineering, Islamic Azad University of Qazvin, Qazvin, Iran

2 Dept. of Electrical and Computer Engineering, Shahid Rajaee Teacher Training University, Tehran, Iran

Abstract

Due to the increase in the number of organizations that want to create data warehouses in order to use its business benefits, an approach for decision making is required. Relational, multi dimensional and tabular models addresses this goal by supporting a broad range of reporting and analysis. The difference between the aforementioned model specifications and operations makes decision making difficult when choosing a data warehouse model. One of the reasons that organizations have not been successful in creating a data warehouse and have spent much time and money for its generation is that they have yet to fully appreciate the need of an appropriate model. The contribution of this paper is using a fuzzy multi-criteria decision making approach for choosing a model for data warehouse creation based on requirements of organizations, features of implementation, data model, business logic, data access and storage, and security. Based on a case study conducted in this paper, and with analysis and identification of the most important criteria and when compared with an Analytical Hierarchy Process method, the proposed framework is shown to reduce both cost and time of data warehouse creation due to proper decision making based on organizations requirements.

Keywords


1-  

[1]

تصمیم‏گیری را می‏توان به عنوان مهم‏ترین چالش پیش روی کارشناسان و تحلیل‏گران در حل مسائل مختلف دانست. به همین علت‏، طی چند دهه اخیر روش‏ها و الگوریتم‏های مختلفی برای پشتیبانی از تصمیم‏گیری ارایه شده است. کیفیت مدیریت اساساً تابع کیفیت تصمیم‏گیری است، زیرا کیفیت طرح‏ها و برنامه‌ها، اثربخشی و کارآمدی راهبردها و کیفیت نتایجی که از اعمال آن‏ها به دست می‌آیند همگی تابع کیفیت تصمیماتی است که مدیر اتخاذ می‌کند. در بیشتر موارد تصمیم‌گیری‌ها وقتی مطلوب و مورد رضایت تصمیم‌گیرنده است که براساس چندین معیار بررسی شده باشد. در روش‏های تصمیم‌گیری چند معیاره که در دهه‌های اخیر مورد توجه پژوهشگران قرار گرفته است به جای استفاده از یک معیار سنجش، از چند معیار سنجش استفاده می‌شود. مدل‌های تصمیم‏گیری چند معیاره به منظور انتخاب گزینه برتر از بین گزینه‏های موجود استفاده می‏شوند. این انتخاب با توجه به معیارهای تعریف شده، و از طریق بررسی ویژگی‏های گزینه‏های مورد مقایسه در تصمیم‏گیری انجام می‏شود [1].

پایگاه داده تحلیلی[1] مدل‏های داده‏ای[2] متفاوتی دارد که توصیه برای استفاده از هر مدل، بر اساس ویژگی‏های آن ممکن است متغیر باشد [2]. هدف این مقاله، کمک به تصمیم‏گیری برای انتخاب مدل مناسب پایگاه داده تحلیلی بر اساس نیاز سازمان از طریق یک روش‏ تصمیم‏گیری چند معیاره فازی (FMDM)[3] [3] و مقایسه آن با روش تحلیل سلسله مراتبی فازی (Fuzzy AHP)[4]  [4] است. بر اساس مطالعه موردی انجام گرفته در این مقاله، این روش سبب تصمیم‏گیری مناسب بر حسب نیاز سازمان، و در نتیجه کاهش هزینه و عدم اتلاف وقت در ایجاد پایگاه داده تحلیلی می‏شود.

مسائل تصمیم‏گیری چند معیاره به دو نوع از مسائل تقسیم می‏شوند. یکی مسائلی که وزن معیارها به شکل قطعی اندازه‏گیری می‏شود [5]. نوع دوم مسائل تصمیم‏گیری چند معیاره فازی [29-26،20، 15-6،4،3] که وزن معیارها به شکل غیر قطعی ارزیابی شده و به طور معمول به شکل متغیرهای گفتاری و به تبع آن اعداد فازی بیان می‏شوند [6].

روش‏های تصمیم‏گیری فازی در حوزه انتخاب سیستم‌های نرم‏افزاری [20، 15-6،4،3] به علت تنوع سیستم‌های نرم‏افزاری، کاربردهای متنوع آن‏ها و در نتیجه کمک به تصمیم‏گیری کاربران در انتخاب آن‏ها با توجه به نیازشان، به طور بیشتری مورد توجه هستند. روش‏ها و چارچوب‏های مختلفی تا کنون برای انتخاب سیستم‏های نرم‏افزاری با استفاده از روش‏های تصمیم‏گیری چند معیاره فازی و تحلیل سلسله مراتبی فازی ارایه شده‏اند.

در [7] چارچوب جامعی برای ارزیابی سیستم‏های نرم‌افزاری بر اساس روش‏های تصمیم‏گیری چند معیاره از طریق نظریه فازی توسعه یافته است. یک روش مجموعه فازی برای انتخاب چندم عیاره نرم‏افزار شبیه‏ساز شی‏ءگرا برای تحلیل سیستم‏های تولید در [8] توسعه یافته است.

Eldrandaly یک روش تصمیم‏گیری جدید را برای انتخاب نرم‏افزار سیستم اطلاعات جغرافیایی، توسط تجمیع سیستم‏های خبره و روش‏های تصمیم‏گیری چند معیاره پیشنهاد داده است [9]. Blance و Jelassi در [10] یک روش تصمیم‏گیری چند معیاره برای انتخاب یک سیستم پشتیبان تصمیم‏گیری (DSS) [5] مناسب ارایه کرده‏اند. Mamaghani از فرآیند تحلیل سلسله مراتبی طراحی شده برای تصمیمات مستلزم ادغام اطلاعات کیفی و کمی برای ارزیابی و انتخاب آنتی‏ویروس و نرم‏افزار فیلتر محتوا استفاده کرده است [11]. Philips Wren نیز در [12] از روش‏های فازی برای انتخاب یک سیستم برنامه‏ریزی منابع سازمانی (ERP) [6] مناسب استفاده کرده است. در [13] نیز از روش تصمیم‏گیری چند معیاره فازی برای ارزیابی آمادگی سازمان برای پیاده‏سازی سیستم برنامه‏ریزی منابع سازمانی استفاده شده است.

در [14] از روشی مبتنی بر نظریه فازی و تحلیل سلسله مراتبی برای برای انتخاب تأمین کننده مناسب سیستم برنامه‌ریزی منابع سازمانی استفاده شده است. در [15] از مدل تصمیم‏گیری چند معیاره فازی برای انتخاب تأمین‏کننده مناسب پایگاه داده تحلیلی بر حسب نیاز سازمان استفاده شده است.

این مقاله شامل 4 بخش دیگر است. در بخش دوم، مدل فازی استفاده شده در این مقاله و مدل‏های داده‏ای پایگاه داده تحلیلی شرح داده شده است. در بخش سوم، انتخاب مدل داده‏ای پایگاه داده تحلیلی توسط روش تصمیم‏گیری چند معیاره فازی پیشنهادی مقاله انجام شده است. در بخش چهارم، نتایج مطالعه موردی محاسبه شده در فصل سوم با نتایج روش تحلیل سلسله مراتبی فازی مقایسه شده و در بخش پنجم، نتایج ارایه شده‏است.

 

2- مفاهیم مقدماتی

در این بخش، مفاهیم پایه استفاده شده در این مقاله شرح داده می‏شود. برای این منظور، متغیرها، تابع هدف و مدل تصمیم‏گیری چند معیاره فازی مورد استفاده در این مقاله [3]، در بخش 2-1 شرح داده شده است.

مدل داده، موضوعی است که با هدف سازمان‏دهی داده‏های ناهمگون برای دست‏یابی به یک مدل تحلیلی مؤثر و کارآمد برای گزارش‏گیری و پشتیبانی از نیازهای تحلیلی کسب ‏و کار، همواره مورد مطالعه متخصصان بوده است [17،16]. مدل‏های تحلیلی رابطه‏ای[7]، چندبعدی[8] و برگه‏ای[9] مدل‏های داده‏ای پایگاه داده تحلیلی هستند که به عنوان جایگزین‏های مورد مقایسه این مقاله، در بخش 2-2 شرح داده شده‏است.

2-1- معرفی مدل فازی مقاله

اگر مجموعه A مجموعه‏ای از جایگزین‏ها برای انتخاب در نظر گرفته شود، در هر سیستم  دو حالت می‏تواند وجود داشته باشد: انتخاب سیستم و عدم انتخاب سیستم.

K گروه تصمیم‏گیر ، برای بررسی میزان اهمیت   معیار  و مناسب بودن  جایگزین  بر اساس این  معیار وجود دارد. ،  را وزن منسوب شده به معیار  توسط تصمیم‏گیرنده  و  و  را رتبه منسوب شده به جایگزین  توسط تصمیم‏گیرنده  بر مبنای معیار  است.

تابع هدف بر حسب متغیرهای تصمیم نوشته می‏شود، و تصمیم‏گیرنده کوشش در حداکثر و یا حداقل کردن آن دارد. در مسائلی که هدف ماکسیمم‏سازی باشد، مناسب‏ترین انتخاب، آن است که تابع هدفش بیشترین مقدار را داشته باشد. بنا به محاسبات Chen در [18]، مجموعه بیشینه‏ساز  ،  ، با در نظر گرفتن رابطه (1)، و مجموعه کمینه‏ساز   نیز، ، با در نظر گرفتن رابطه (2) تعریف شده است.

(1)

 

(2)

 

 

که  در آن:

 

 

همچنین  در رابطه (3) ارتفاع سمت راست و  در رابطه (4) ارتفاع سمت چپ را نشان می‏دهد. در نهایت، رتبه‏بندی مقادیر فازی جایگزین i، توسط رابطه (5) انجام می‏گیرد.

(3)

 

(4)

 

(5)

 

 

جایگزینی که بیش‏ترین میزان  را کسب کند بهترین انتخاب برای سازمان است. همان‏طور که بیان شد،  رتبه جایگزین بر مبنای معیار  و با توجه به تصمیم‏گیرنده  است. برای رتبه‏بندی جایگزین‏ها توسط ماتریس فازی رابطه (6) ارایه شده است.

(6)

 

 

میزان اهمیتی که طبق نظر تصمیم‏گیرنده  به معیار  داده می‏شود در رابطه (7) آورده شده است.

 

(7)

 

 

در ارزیابی‏ها، مقادیر به شکل کیفی بیان می‏شوند، به علت غیر دقیق بودن مقادیر کیفی، از تئوری مجموعه فازی برای مقداردهی به ماتریس R و A استفاده می‏شود.

تئوری مجموعه فازی در سال 1965 توسط Zadeh معرفی شد [19]. این تئوری برای حل مسائلی که به شکل مبهم و غیر دقیق بیان شوند، استفاده می‏شود. زیر مجموعه فازی A از مجموعه  توسط تابع فازی  تعریف می‏شود، این تابع هر عنصر  در مجموعه  را به مقداری بین [1-0] نگاشت می‏کند. در این مقاله، از مقادیر فازی مثلثی[10]، به عنوان تابع عضویت[11] استفاده شده است. علت‏ استفاده از این مقادیر، سهولت استفاده و انجام محاسبات آن برای تصمیم‏گیران است. یک عدد فازی، یک عدد فازی مثلثی است اگر تابع عضویت آن با توجه به مقادیر فازی مثلثی شکل (1) تعریف شود.

 

شکل (1): تابع عضویت مقادیر فازی مثلثی

 

طبق تحلیل‏های انجام شده توسط متخصصان پایگاه داده تحلیلی در [15] ، اهمیت هر معیار توسط واژه‏هایی مانند بسیارکم، کم، متوسط، بالا و بسیار بالا که توسط مقادیر فازی مثلثی جدول (1) بیان شده‏اند، ارزیابی می‏شود. همچنین، بر اساس تحلیل‏های انجام شده توسط این متخصصان، رتبه هر یک از جایگزین‏ها توسط واژه‏هایی مانند بسیار ضعیف، ضعیف، منصفانه، خوب و بسیارخوب که توسط مقادیر فازی مثلثی جدول (2) بیان شده‏اند، ارزیابی می‏شود. این توابع عضویت در برنامه‏های مختلفی از جمله در انتخاب روبات در [20]، انتخاب پایگاه داده تحلیلی مناسب در [15] و انتخاب نرم‏افزار شبیه‏ساز شی‏گرا [8] استفاده شده‏اند.

از اصل توسعه Zadeh نیز می‏توان به منظور محاسبه توابع عضویت، پس از نگاشت مجموعه‏های فازی به واسطه یک تابع استفاده کرد [19]. بردار فازی انتخاب جایگزین مناسب، به شکل رابطه (8) محاسبه می‏شود. این بردار F1,F2,.. رتبه هر جایگزین را بیان می‏کند.

(8)

 

2-2- مدل‏های داده‏ای پایگاه داده تحلیلی

پایگاه داده تحلیلی از پایگاه‏های داده عملیاتی (DB) [12] و یا سایر منابع داده‏ای توزیع شده سازمان‏های متفاوت تهیه می‏شود و بستر مناسبی فراهم می‏آورد تا داده‏ها به منظور پاسخگویی به پرسش‏های تحلیلی به شکل بایگانی شده، سرجمع شده و سازمان یافته ذخیره شوند. روند ایجاد و استفاده از پایگاه داده تحلیلی در شکل (2) آورده شده است.

در ابتدا به واسطه جلساتی که با گروه‏های مختلف کاربران برگزار می‏شود و انواع روش‏های موجود برای جمع‏آوری نیازمندی‏ها [21]، نیاز تحلیل‏های کاربران نهایی تعریف می‏شود. مدل منطقی داده بر اساس خواسته‏های کاربران طراحی شده و سپس، به مدل فیزیکی داده ترجمه می‏شود.

در این مرحله پس از طراحی پایگاه داده تحلیلی در لایه دوم شکل (2)، تشخیص و حذف خطاهای موجود در داده‏هایی از منابع داده لایه اول (شامل داده‏های غلط، ناقص، تکراری، متناقض و یا با ساختار نامناسب)، که برای تحلیل در پایگاه داده تحلیلی مشخص شده‏اند، انجام می‌گیرد. سپس، طی فرآیند استخراج، تبدیل و بارگذاری (ETL) [13] این داده‏ها در پایگاه داده تحلیلی بارگذاری می‌شوند [17].

مدل رابطه‏ای: پایگاه داده تحلیلی رابطه‏ای، توسط سرور پایگاه داده عملکردی ایجاد می‏شود. تفاوت آن با پایگاه داده عملیاتی در طراحی متمایز مدل، بر اساس موضوعات[14] تحلیل است.

 

 

جدول (1): واژه‌های مورد استفاده در بیان میزان اهمیت معیارها

واژه‌های مورد استفاده در میزان اهمیت معیارها

واژه‌های کیفی

بسیار بالا (VH)

بالا (H)

متوسط (M)

کم (L)

بسیار کم (VL)

مقادیر فازی مثلثی

(1،1،7/0)

(1،7/0،5/0)

(8/0،5/0،2/0)

(5/0،3/0،0)

(3/0،0،0)

 

جدول(2): واژه‏های مورد استفاده در رتبه‏بندی جایگزین‏ها

واژه‏های مورد استفاده در رتبه‏بندی جایگزین‏ها

واژه‏های کیفی

بسیار خوب (VG)

خوب (G)

منصفانه (F)

ضعیف (P)

بسیار ضعیف

(VP)

مقادیر فازی مثلثی

(1،1،8/0)

(1،8/0،6/0)

(7/0،5/0،3/0)

(4/0،2/0،0)

(2/0،0،0)

 

 

 

 

شکل (2):روند ایجاد و استفاده از پایگاه داده تحلیلی

 

 

با اینکه پایگاه داده تحلیلی رابطه‏ای پاسخ‏گوی بسیاری از پرسش‏های تحلیلی است، اما برخی از این پرسش‏ها با استفاده از دستورات پایگاه داده تحلیلی رابطه‏ای به راحتی بیان نمی‏شوند و یا اگر قابل بیان باشند، کارایی آن‏ها به شدت پایین است. لزوم نوشتن پرسش‏های پیچیده، سرعت کم در پاسخگویی به پرسش‏ها، عدم پشتیبانی از برخی توابع و عملکردها و حجم ناکافی برای ذخیره داده‏های مورد نیاز برای پاسخگویی به پرسش‏های تحلیلی کاربران نیز از جمله دیگر معایب پایگاه‏ داده‏های‏ تحلیلی رابطه‏ای است.

با توجه به شکل (2)، در صورتی که مدل رابطه‏ای پاسخگوی نیاز کاربران نباشد می‏توان با استفاده از پایگاه داده تحلیلی رابطه‏ای ایجاد شده، مدل‏های چندبعدی و یا برگه‏ای ایجاد کرد.

مدل چندبعدی: پایگاه داده تحلیلی چند بعدی، متخصصان هوش تجاری را قادر ساخته است تا از طریق پایگاه داده تحلیلی رابطه‏ای، مکعب‏های[15] چندبعدی پیچیده‏ای ایجاد کنند. مدل چندبعدی، مکعب‏هایی متشکل از مقادیر[16]و بعد[17]هایی بر اساس داده‏های مشتمل در پایگاه داده تحلیلی رابطه‏ای را ایجاد می‏کند.

در این حالت، موتور پردازش تحلیلی آنلاین از مدل چندبعدی برای پیش تجمیع حجم زیاد داده و در نتیجه پشتیبانی از زمان پاسخ سریع استفاده می‏کند. موتور پردازش تحلیلی آنلاین، می‏تواند مقادیر تجمیع شده را با روش پردازش تحلیلی چند بعدی MOLAP [18] بر روی دیسک و یا در پایگاه داده رابطه‏ای با روش ROLAP [19] ذخیره کند.

اگرچه این مدل جامع بوده و تحلیل‏های پیچیده از مزایای مهم مدل چندبعدی است، اما آن‏ها بیشتر چرخه توسعه طولانی‏تری داشته و توانایی تطبیق سریع با شرایط متغیر کسب و کار را ندارند. به علاوه، مدل چندبعدی نیاز به مهارت‏های مدل‏سازی پیشرفته و یادگیری زبان MDX[20]دارد.

مدل برگه‏ای: مدل برگه‏ای توسط PowerPivot مایکروسافت اکسل 2010 معرفی شده است، و  قابلیت‏های مدل‏سازی داده به روش خودکار را برای کسب ‏و کار و تحلیل‏گران داده فراهم می‏آورد. مدل برگه‏ای قابلیت دسترسی بیشتری را برای کاربرانی که با ابزارهای تولید دسکتاپ مانند اکسل و مایکروسافت اکسس کار کرده‏اند، فراهم کرده است. این مدل، داده را در جداول مرتبط سازمان‏دهی می‏کند. در حالت برگه‏ای، می‏توان از موتور xVelocity برای بارگذاری داده در حافظه، که به پاسخ‏گویی سریع منجر می‏شود، و یا از پرسشی مستقیم برای ارسال پرسش‏ها به پایگاه داده منبع استفاده کرد.

شناخته شده بودن و انعطاف پذیری از مزایای مهم مدل برگه‏ای هستند، اما در عین حال این مزایا، معایبی را نیز به همراه می‏آورد. برای مثال، مدل برگه‏ای برای راه کارهایی که مجموعه داده‏های بسیار پیچیده‏ای داشته یا نیاز به منطق کسب و کار پیچیده‏ای دارند مناسب نیست. کاربران زبان DAX[21] گاه قادر خواهند بود تا فرمول‏های DAX برای ارایه توابع تحلیلی ایجاد کنند، در غیر این صورت این توابع در مدل برگه‏ای قابل دسترس نخواهند بود. در برخی از این موارد استفاده از توانایی‏های پیشرفته‏ای که در محیط مدل چند بعدی فراهم شده، مناسب و کارآمدتر است.

3- تصمیم‏گیری چندمعیاره فازی پیشنهادی

مراحل روش تصمیم‏گیری چند معیاره فازی این مقاله در نمودار فعالیت شکل 3 آورده شده است. هر یک از فعالیت‏های این نمودار در ادامه شرح داده می‏شود.

سازمان‏ها بنا به خصوصیاتشان ممکن است از پایگاه‏ داده تحلیلی رابطه‏ای استفاده کرده یا تصمیم به ایجاد پایگاه داده تحلیلی چندبعدی یا برگه‏ای بگیرند. بنابراین، لازم است تا با توجه به اهداف حرفه و نیازهای سازمان، معیارهای مناسبی برای مقایسه مدل‏ها تعیین شوند.

از آنجا که تصمیم مربوط به انتخاب مدل داده‏ای پایگاه داده تحلیلی است، بهتر است تا تصمیم‏گیری انتخاب معیارها به شکل کمیته‏ای باشد. در روش دلفیکه نوعی پژوهش کمیته‏ای است، هدف، دسترسی به مطمئن‏ترین توافق گروهی خبرگان در مورد موضوعی خاص است که با استفاده از پرسشنامه و نظرخواهی از خبرگان، به‏دفعات و با توجه به بازخورد حاصل از آن‏ها انجام می‏شود. روش دلفی که در زمینه‏های متعدد تصمیم‏گیری استفاده می‏شود [22] در دهه 1980 میلادی توسط کافمن و گوپتا ابداع شد [23]. کاربرد این روش به منظور تصمیم‌گیری و توافق نظر جمعی بر مسائلی که اهداف و شاخص‏ها به صراحت مشخص نیستند، می‏باشد و به نتایج بسیار ارزنده‏ای منجر می‏شود.

با توجه به اهمیت داشتن بیشتر تجربه، نسبت به تعداد متخصصان در روش دلفی، در این مقاله به منظور تعیین متخصصان کمیته، ابتدا فهرستی از نام تمامی کارشناسان در دسترس سازمان تهیه شد. این افراد با توجه به تخصص‌های مربوطه گروه‏بندی و طبق میزان شایستگی رتبه‏بندی شدند. در نهایت، از 6 نفر از متخصصان (با میانگین 5/9 سال سابقه در حوزه فناوری اطلاعات و کسب و کار) با توجه به توانایی تیم پژوهش در اداره مطالعه، اعتبار داخلی و خارجی، زمان جمع آوری داده‏ها و منابع در دسترس برای شرکت در کمیته دعوت شد.

 

شکل(3): مراحل تصمیم‌گیری چندمعیاره فازی مقاله

سپس، فهرست اولیه از اهداف، شامل: اهداف اصلی و فرعی سازمان تهیه شد. برای ایجاد فهرست اهداف نیاز است تا مواردی که سازمان تمایل دارد تا به آن‏ها دست یابد بیان شوند. سپس، این اهداف در کنار یکدیگر بررسی می‏شوند تا اهداف اصلی و فرعی با ساختار سلسله مراتبی بیان شوند [24].

معیارهای متفاوت به ارزیابی‏های متفاوت و در نتیجه، به تصمیم‏گیری ناموفق منجر می‏شود. در سازمان مورد مطالعه، از میان 30 هدفی که طی مراحل متعدد ارسال پرسشنامه در کمیته بیان شد، تصمیم‏گیران باید برخی از این اهداف را برای تصمیم‏گیری انتخاب کنند. در نهایت، 15 معیار انتخاب شد. معیارهای انتخاب شده با چهار مشاور خبره پایگاه داده تحلیلی در دو سازمان معتبر خارج از سازمان، مشورت شده و تأیید شدند. فرآیند دلفی فازی مورد استفاده برای تصمیم‏گیری در مورد معیارها در شکل (4) آورده شده است. نتایج حاصل از شمارش پاسخ‏های پرسشنامه اول خبرگان برای جمع‏بندی نظرات در انتخاب معیارها در جدول (3) آورده شده است. در جدول (4)، معیارهای نهایی در یک ساختار سلسله مراتبی ارایه شده‏اند.

 

شکل (4): مراحل اجرای روش دلفی فازی

 

 

جدول (3): نتایج حاصل از شمارش پاسخ‌های پرسشنامه اول

ردیف

مولفه‏ها

انتخاب مدل داده‏ای پایگاه داده تحلیلی

کم

متوسط

زیاد

1

مدت زمان پیاده‏سازی مدل‏های پایگاه داده تحلیلی

0

2

4

2

کارایی ETL

3

2

1

3

ویژگی‏های افزونه

0

3

3

4

محاسبات ساده

0

2

4

5

محاسبات پیچیده

1

0

5

6

توابع تجمیعی

0

4

2

7

مدیریت فراداده

4

2

0

8

حجم قابل توسعه

0

1

5

9

کارایی

0

0

6

10

هزینه‏های مستقیم

4

0

2

11

هزینه‏های غیر مستقیم

3

2

1

12

ابزارهای کاربری

0

1

5

13

برنامه‏نویسی

1

2

3

14

امنیت

0

1

5

15

پشتیبانی و مدیریت مدل داده پایگاه داده تحلیلی

4

1

1

16

واسط کاربری

2

0

4

17

قابلیت تجمیع

5

0

1

18

ذخیره‏سازی داده

1

0

5

19

نحوه دسترسی به اطلاعات

2

1

3

پیشنهادات

1

شاخص‏های عملکردی

-

-

-

2

تبدیلات نرخ ارز

-

-

-

           

 

 

 

جدول (4): معیارهای نهایی برای تصمیم‏گیری برای انتخاب مدل پایگاه داده تحلیلی

خصوصیات

معیارهای تصمیم‏گیری

توصیف

زمان

زمان پیاده‏سازی (C1)

مدت زمان پیاده سازی مدل‏های پایگاه داده تحلیلی به زمان تحلیل، طراحی و پیاده‏سازی مدل بستگی دارد. عوامل متعددی مانند میزان آشنایی با مدل، سرعت زمان یادگیری مدل و ... نیز بر این مراحل تأثیرگذارند.

مدل داده

سلسله مراتب (C2)

به منظور انجام تحلیل‏های drill-down، سلسله مراتب‏ها داده‏ها را در ساختارهای درختی دسته‏بندی می‏کنند.

ویژگی‏های افزونه (C3)

- Actions

- Perspective

- Drill through

- Stored Procedured...

منطق

کسب و کار

محاسبات ساده (C4)

محاسبات پیچیده (C5)

- یادگیری زبان

- توانایی انجام محاسبات لازمه

توابع تجمیعی (C6)

- variouse Time Intelligence Functions

- Count, Distinct Count

- Min,Max

- Average Of Children...

شاخص‏های عملکردی (C7)

شاخص‏های عملکردی مقادیر خاصی هستند که برای مقایسه با مقادیر هدف و در نتیجه ارزیابی عملکرد استفاده می‏شوند.

تبدیلات نرخ ارز (C8)

تبدیلات نرخ ارز به منظور تبدیل از یک یا چند نرخ منبع به یک یا چند نرخ مورد گزارش‏گیری استفاده می‏شوند.

دستیابی و ذخیره سازی داده

حجم قابل توسعه (C9)

در سیستم‏های تحلیلی حجم قابل توسعه معیار مهمی است که باید به آن توجه شود.

کارایی (C10)

کارایی پرسش‏ها تأثیر مستقیمی بر تجربیات کاربران دارد و یکی از نکات مهمی است که برای ارزیابی میزان موفقیت یک سیستم تحلیلی استفاده می‏شود. کارایی پردازش‏ها نیز به سرعت دسترسی کاربران به داده‏های به‏روزرسانی شده بستگی دارد.

منابع داده (C11)

- منابع داده رابطه‏ای

- Excel

- Odata Feeds...

ذخیره‏سازی داده (C12)

- MOLAP

- ROLAP

- In-Memory ...

ابزارهای کاربری (C13)

- Excel

- Reporting Services

- Mirosoft Performance Point...

برنامه‏نویسی (C14)

برای توسعه و مدیریت اشیا، سرویس‏های تحلیلی استفاده می‏شوند.

امنیت

امنیت (C15)

امنیت، دسترسی افراد مجاز به داده‏های مجاز را بیان می‏کند.


3-1- رتبه‌بندی جایگزین‌ها و تشکیل ماتریس R

در فعالیت‏های رتبه‏بندی جایگزین‏ها با روش فازی و تشکیل ماتریس R نمودار فعالیت شکل (3)، مدل‏ها رتبه‌بندی می‏شوند. این رتبه‏بندی می‏تواند به موازات فعالیت‏های تعیین اهمیت معیارها با روش فازی و تشکیل ماتریس A انجام گیرد.

رتبه‏بندی مدل‏ها به این شکل است که متخصصان کمیته، توانایی‏های استاندارد بیان شده توسط تأمین کننده محصول [16، 17 و 25] را جمع‏آوری کرده و پس از مطالعه و بررسی آن‏ها و انجام مشاوره‏های تخصصی از طریق رایانامه با تأمین‏کننده برای شناخت محصول، توانایی مدل‏ها را بر اساس معیارهای جدول (4) مقداردهی می‏کنند. (برای تشکیل ماتریس R آورده شده در (6)).

تعیین رتبه گزینه‏ها با توجه به معیار C1 (زمان پیاده سازی): با توجه به جدول (4)، مدت زمان پیاده‏سازی پایگاه‏ داده تحلیلی به زمان تحلیل، طراحی و پیاده‏سازی مدل‏ بستگی دارد. به طور کلی، طراحی و پیاده‏سازی پایگاه‏های داده تحلیلی به شکل یک معماری چند لایه است. در این معماری لایه زیرین منابع اولیه داده را تشکیل می‏دهند، که تحلیل آن‏ها برای طراحی جداول پایگاه داده تحلیلی رابطه‏ای، با توجه به اهداف و موضوعات پایگاه داده تحلیلی رابطه‏ای انجام می‏شود. پس از طراحی مدل رابطه‏ای، طی فرآیند استخراج، تبدیل و بارگذاری، داده‏های پردازش شده در پایگاه داده تحلیلی رابطه‏ای بارگذاری می‏شوند.

پایگاه داده تحلیلی با مدل چندبعدی، چرخه توسعه طولانی‏تری داشته و نیاز به ساخت جداول بعد و حقیقت، ایجاد سلسله مراتب‏ها، توابع تجمیعی و روابط میان جداول و ساخت مکعبچند بعدی در محیط BI [22]دارد. مدل برگه‏ای در نتیجه بارگذاری مدل رابطه‏ای در محیط اکسل حاصل می‏شود. داده‏های مدل چندبعدی و برگه‏ای طی پردازشی از طریق مدل رابطه‏ای تأمین می‌‌شوند.

به دلیل نیاز داشتن به زمان و دانش بیشتر طراحی و پیاده‌سازی مدل چندبعدی نسبت به مدل رابطه‏ای و برگه‌ای، این سه مدل بنا به میانگین نظرات 6 متخصص تصمیم‏گیرنده، در مقایسه با هم برای معیار C1، مقدار کمی (1، 3/0 و 1/0) برای مدل چندبعدی که چرخه توسعه طولانی‏تری نسبت به دو مدل دیگر دارد، مقدار کمی (95/0، 81/0 و 61/0) برای مدل رابطه‏ای و (9/0، 73/0 و 53/0) را برای مدل برگه‏ای به خود اختصاص داده‏اند.

تعیین رتبه گزینه‏ها با توجه به معیار C2 (سلسله مراتب): در مدل چندبعدی ساخت سلسله مراتب‏های استاندارد، والد- فرزند و ناهموار[23] با امکانات تعبیه شده در نرم‏افزار به‏سادگی امکان‏پذیر است [25،17،16] ، در صورتی که ساخت این سلسله مراتب‏ها در مدل رابطه‏ای احتیاج به کدنویسی‏های دشواری، به ویژه در سلسله مراتبی از نوع ناهموار دارد که کار را دشوار می‏کند. در مدل برگه‏ای نیز، سلسله مراتب استاندارد به راحتی پشتیبانی شده و سلسله مراتب والد- فرزند نیاز به کدنویسی‏های دشواری به زبان DAX دارد. با توجه به توانایی مدل‏ها در این معیار، میانگین نظرات 6 متخصص تصمیم‏گیرنده مقادیر فازی (7/0، 51/0 و 31/0) برای مدل رابطه‏ای، (1،93/0 و 73/0) برای مدل چندبعدی و (9/0،7/0 و 5/0) برای مدل برگه‏ای به دست آمد.

تعیین رتبه گزینه‏ها با توجه به معیار C3 (ویژگی‏های افزونه مدل): در جدول (5) توانایی ویژگی‏های افزونه برای هر یک از مدل‏ها آورده شده است [25،17،16]. مدل رابطه‏ای برخی از این ویژگی‏های افزونه را در محیط خود پشتیبانی می‏کند، برای مثال توانایی Translations ندارد و یا ساخت Drill through وWrite-back در آن احتیاج به کدنویسی دشواری دارد. در صورتی که توانایی ساخت آن‏ها در محیط چندبعدی تعبیه شده و به سادگی قابل تنظیم است. میانگین نظرات کمیته تصمیم‏گیرنده برای معیار C3، به ترتیب (8/0، 6/0 و 4/0)، (1، 9/0 و 7/0) و (75/0، 55/0 و 35/0) برای مدل‏های رابطه‏ای، چندبعدی و برگه‏ای به دست آمد.

جدول (5): مقایسه ویژگی‏های افزونه

ویژگی‏های افزونه

مدل‏های پایگاه داده تحلیلی

برگه‏ای

رابطه‏ای

چندبعدی

Actions

û

ü

ü

Perspective

ü

ü

ü

Drill through

ü

راه‏حل‏های پیچیده‏ای موجود است

ü

Stored Procedured

û

ü

ü

Write-back

û

راه‏حل‏های پیچیده‏ای موجود است

ü

tranlations

û

û

ü

 

تعیین رتبه گزینه‏ها با توجه به معیار C4 (محاسبات ساده): زبان MDX مدل چندبعدی، به علت دشوارتر بودن یادگیری آن نسبت به زبان‏‏های مدل رابطه‏ای و DAX مدل برگه‏ای، برای محاسبات ساده توصیه نمی‏شود. میانگین نظرات با توجه به سهولت یادگیری و رایج بودن زبان محاسباتی مدل رابطه‏ای و توانایی آن در پردازش محاسبات ساده به مقدار (9/0، 73/0 و 53/0) و مقادیر (8/0، 6/0 و 4/0) و (1، 83/0 و 63/0) برای مدل‏های رابطه‏ای و برگه‏ای تخصیص داده شده است.

تعیین رتبه گزینه‏ها با توجه به معیار C5 (محاسبات پیچیده): زبان محاسباتی MDX پردازش محاسبات پیچیده را به شکل کارآمدتری نسبت به زبان‏های مدل رابطه‏ای و DAX مدل برگه‏ای پشتیبانی می‏کند. در مدل رابطه‏ای و برگه‏ای امکان پردازش برخی محاسبات پیچیده یا وجود ندارد و یا بسیار دشوار است. با توجه به توانایی زبان MDX ، نظرات کمیته (1، 9/0 و 7/0) برای مدل چندبعدی و مقادیر فازی (35/0، 18/0 و 05/0) و (9/0، 7/0 و 5/0) برای مدل‏های رابطه‏ای و برگه‏ای به دست آمد.

تعیین رتبه گزینه‏ها با توجه به معیار C6 (توابع تجمیعی): توابع تجمیعی پشتیبانی شده در هر یک از مدل‌های داده در جدول 6 آورده شده است. مدل چندبعدی علاوه بر پشتیبانی توابعی از جمله Sum، Count و Max که در مدل رابطه‏ای و برگه‏ای نیز پشتیبانی می‏شوند، توابع تجمیعی بیشتری را پشتیبانی می‏کند. به علت توانایی ذخیره توابع تجمیعی از پیش محاسبه شده در سلول‏های مکعب چندبعدی، کارایی بازیابی پرسش‏ها نیز بیشتر است. میانگین کمی نظرات کمیته برای این معیار (5/0، 3/0 و 1/0) برای مدل رابطه‏ای و (1، 93/0 و 6/0) و (85/0، 65/0 ئ 45/0) برای مدل‏های چندبعدی و برگه‏ای است.

 

 

جدول (6): توابع تجمیعی مدل‏ها

 

مدل‏های پایگاه داده تحلیلی

برگه‏ای

رابطه‏ای

چندبعدی

توابع تجمیعی

Sum

Sum

Sum

Count

Count

Count

Min, Max

Min, Max

Min, Max

Average

STDEV

None

FirstDate

VAR

ByAccount

LastDate

-

AverageOf Children

OpeningBalanceMonth

-

FirstChild

ClosingBalanceMonth

-

LastChild

-

-

FirstNonEmpty

-

-

LastNonEmpty

 

 

رتبه گزینه‏ها با توجه به معیار C7 (شاخص‏های عملکردی): شاخص‏های عملکردی مدل رابطه‏ای از جمله Actual، goal، status که در جدول (7) آورده شده‏اند توسط مؤلفه‏هایی مانند SQL Reporting Services و یا PerformancePoint Services فراهم آورده می‏شود و امکاناتی برای ارایه این شاخص‏ها در محیط مدل رابطه‏ای وجود ندارد. این شاخص‏ها در محیط مدل‏های چند بعدی و برگه‏ای تعبیه شده‏ و به راحتی قابل دستیابی هستند. با توجه به توانایی بیشتر مدل چندبعدی و برگه‏ای در فراهم آوردن این معیار و کارکرد دشوارتر این معیار در مدل رابطه‏ای، نظرات کمیته در رابطه با این معیارها به ترتیب (18/0، 18/0 و 05/0)، (1، 9/0 و 7/0) و (95/0، 78/0 و 58/0) برای مدل‏های رابطه‏ای، چندبعدی و برگه‏ای به دست آمد.

 

جدول (7): شاخص‏های عملکردی

شاخص‏های عملکردی

مدل‏های پایگاه داده تحلیلی

برگه‏ای

رابطه‏ای

چندبعدی

شاخص‏های عملکردی

Actual

راه‏حل‏های پیچیده

Actual

goal

راه‏حل‏های پیچیده

goal

status

راه‏حل‏های پیچیده

status

graphical indicators

راه‏حل‏های پیچیده

trend

-

راه‏حل‏های پیچیده

graphical indicators

 

 

تعیین رتبه گزینه‏ها با توجه به معیار  C8 (تبدیلات نرخ ارز): در مدل چندبعدی تبدیلات نرخ ارز با استفاده از BI Wizard  اما در مدل رابطه‏ای و برگه‏ای این تبدیلات به کمک برنامه‏نویسی انجام می‏گیرد. نظر 6 متخصص کمیته با توجه به توانایی بیشتر مدل چند بعدی در این معیار، مقدار (1، 93/0 و6/0) برای این مدل و مقادیر (41/0، 21/0 و 05/0) و (33/0، 13/0 و صفر) برای مدل‏های رابطه‏ای و برگه‏ای محاسبه شد.

تعیین رتبهگزینه‏ها با توجه معیار C9 (حجم قابلتوسعه): مدل برگه‏ای، با موتور xVelocity برای بارگذاری داده برگه‏ای و فشرده‏سازی 10 برابری آن در حافظه، قابلیت توسعه تا حجم بیلیون‏ها رکورد و مدل چندبعدی با ذخیره توابع از پیش محاسبه شده در سلول‏های مکعب چند بعدی در فضای هارد،  قابلیت توسعه تا حجم چندین ترابایت را بدون تأثیرگذاری بر کارایی پرسش‏ها دارند.

مدل رابطه‏ای با یک پرادازشگر، بدون شاخص‏گذاری مناسب، پارتیشن‏بندی و نرمال کردن جداول قابلیت پردازش حجم بیلیون‏ها رکورد یا چندین ترابایت را ندارد. با توجه به توانایی مدل چندبعدی در پردازش کارآمدتر، حجم بیشتر داده میانگین نظرات تصمیم‏گیران برای این معیار مقادیر فازی (41/0، 35/0 و 15/0)، (1، 93/0 و 6/0) و (85/0، 65/0 و 45/0) برای مدل‏های رابطه‏ای، چندبعدی و برگه‏ای محاسبه شد.

تعیین رتبه گزینه‏ها با توجه معیار C10 (کارایی): در مدل چندبعدی امکان شاخص‏گذاری در پرسش‏ها و استفاده از توابع تجمیعی از پیش ذخیره شده بر روی دیسک وجود دارد. داده جداول بعد و نتایج پرسش‏ها در حافظه ذخیره می‏شود. همچنین، در این مدل امکان فشرده‏سازی داده تا سه برابر ممکن است.

در نتیجه این میزان فشرده‏سازی، و نیز ذخیره توابع تجمیعی از پیش محاسبه شده در سلول‏های مکعب چند بعدی میزان I/O نیز کاهش و کارایی پرسش‏ها افزایش پیدا می‏کند. طراحی کارآمد جداول بعد، ایجاد توابع تجمیعی مؤثر، پارتیشن‏بندی و استفاده از یک استراتژی مناسب برای پردازش نیز از مواردی هستند که بر بهبود کارایی پردازشی مدل چندبعدی تأثیر بهینه دارند.

مدل برگه‏ای با توجه به نحوه ذخیره‏سازی
 In-Memory و امکان فشرده‏سازی داده تا 10 برابر، کارایی بسیار بالایی را ارایه می‏کند. با افزایش حافظه در این مدل کارایی پرسش‏ها به شکل در خور‏ توجهی افزایش می‏یابد. مدل برگه‏ای داده‏ها را به شکل مستقیم در حافظه بارگذاری کرده و نیازی به نوشتن آن‏ها بر روی دیسک ندارد. این مدل به علت‏ عدم دسته‏بندی داده‏ها در جداول بعد، کارایی پردازشی بیشتری ارایه می‏کند.

در مدل رابطه‏ای امکان بهبود کارایی با استفاده از تنظیمات شاخص‏گذاری بر روی پرسش‏ها، کش شدن نتایج پرسش‏ها در حافظه و ذخیره توابع تجمیعی از پیش ذخیره شده بر روی دیسک ممکن است. اما این تنظیمات برای بهبود کارایی بر روی هر نوع پرسشی قابل تنظیم نیستند و نیز امکان فشرده‏سازی داده در این مدل وجود ندارد. میانگین نظرات کمیته برای این معیار مقادیر فازی (5/0، 3/0 و 1/0)، (1، 9/0 و 7/0) و (1، 1 و 8/0) برای مدل‏های رابطه‏ای، چندبعدی و برگه‏ای است.

تعیین رتبه گزینه‏ها با توجه به معیار ‏C11‏ (منابع داده): منابع داده‏ای که توسط هر مدل پشتیبانی می‏شوند در جدول (8) آورده شده است. برای مثال مدل رابطه‏ای توانایی دریافت ورودی از محیط‏های ODBC، Microsoft SQL Server و غیره را دارد. با مقایسه بین سه مدل داده میانگین نظرات تصمیم‏گیران با توجه به توانایی مدل رابطه‏ای در پشتیبانی از منابع داده‏ای بیشتر، برای مدل رابطه‏ای مقدار (73/0، 71/0 و 38/0)، برای مدل برگه‏ای (9/0، 76/0 و 56/0) و برای مدل چندبعدی (41/0، 21/0 و 05/0) محاسبه شد.

تعیین رتبه گزینه‏ها با توجه به معیار C12 (ذخیره‏سازی داده): ذخیره‏سازی داده در مدل چندبعدی به دو شکل MOLAP و ROLAP است. در روشMOLAP میزان کارایی پایگاه داده تحلیلی افزایش می‏یابد، زیرا توابع از پیش محاسبه شده در سلول‏های مکعب چند بعدی ذخیره می‌شوند. اما در این روش، به علت ذخیره مقادیر در مکعب چند بعدی محدودیت حجمی وجود دارد. روش ROLAP عملیات OLAP بر روی داده‏های چند بعدی را به عملیات رابطه‏ای استاندارد نگاشت می‏کند، ولی در این روش محدودیتی از نظر حجمی وجود ندارد. کارایی این مدل به علت اجرای دستورات محیط عملکردی برای پاسخگویی به پرس و جوها پایین است.

در مدل رابطه‏ای، ذخیره و بازیابی اطلاعات توسط اجرای دستورات محیط عملکردی و از طریق حافظه انجام می‏شود.

 

 

جدول (8): منابع داده قابل پشتیبانی در هر مدل داده

پشتیبانی منابع داده

مدل‌های پایگاه داده تحلیلی

برگه‏ای

چندبعدی

رابطه‏ای

منابع داده

–         Access databases

–         SQL Server relational databases

–         SQL Server Parallel Data Warehouse (PDW(

–         Oracle relational databases

–         Teradata relational databases

–         Informix relational databases

–         IBM DB2 relational databases

–         Sybase relational databases

–         Other relational databases

–         Text files

–         Microsoft Excel files

–         PowerPivot workbook

–         Analysis Services cube

–         Data feeds

–         Office Database Connection files

–   SQL Server relational databases

–   Teradata relational databases

–   Informix relational databases

–   IBM DB2 relational databases

–   Sybase relational databases

–   Other relational databases( OLE DB provider or ODBC driver)

 

-       Microsoft SQL Server

-       Microsoft SQL Server Analysis Services for MDX, DMX, Microsoft PowerPivot, and tabular models

-       Microsoft Windows Azure SQL Database

-       SQL Server Parallel Data Warehouse

-       Oracle

-       SAP NetWeaver BI

-       Hyperion Essbase

-       Microsoft SharePoint List

-       Teradata

-       OLE DB

-       ODBC

-       XML

 

 

 

در مدل برگه‏ای از موتور تحلیلی xVelocity برای کش کردن اطلاعات در حافظه استفاده می‏شود. همچنین، بنا به امکان DirectQuery  در مدل برگه‏ای می‏توان از داده‌های موجود در مدل رابطه‏ای نیز استفاده کرد. میانگین نظرات متخصصان کمیته با توجه به توانایی بیان شده برای مدل‏ها در ذخیره و بازیابی اطلاعات (6/0، 35/0 و 15/0)، (1، 9/0 و 7/0) و (1، 96/0 و 76/0) برای مدل‏های رابطه‏ای، چندبعدی و برگه‏ای است.

تعیین رتبه گزینه‏ها با توجه به معیار C13 (ابزارهای کاربری): مدل چندبعدی ابزارهای کاربری Excel، Reporting Services، MicrosoftPerformancePoint را پشتیبانی می‏کند و مدل رابطه‏ای و برگه‏ای نیز توسط این ابزارهای کاربری پشتیبانی می‏شوند. 6 متخصص تصمیم‏گیرنده با مقایسه مدل‏ها به مدل چندبعدی مقدار کمی (1، 88/0 و 66/0)، به مدل برگه‏ای مقدار (1، 88/0 و 66/0) و به مدل رابطه‏ای مقدار کمی (95/0، 81/0 و 61/0) را نسبت داده‏اند.

تعیین رتبه گزینه‏ها با توجه به معیار C14 (برنامه‌نویسی): در جدول (9) قابلیت برنامه‏نویسی برای مدیریت و پیاده‏سازی اشیا (مکعب‏ها، جداول بعد، زبان MDX و...( مدل‏ها بیان شده است. برای مثال با استفاده از زبان XMLA قابلیت پیاده‏سازی و مدیریت اشیا در هر سه مدل وجود دارد. با توجه به جدول (9) توانایی مدل چندبعدی در این معیار، بیشتر از توانایی این معیار در مدل‏های رابطه‏ای و برگه‏ای است. 6 متخصص‌ تصمیم‏گیرنده با مقایسه مدل‏ها به مدل چندبعدی مقدار کمی (1، 9/0 و 7/0)، به مدل برگه‏ای مقدار (8/0، 65/0 و 45/0) و به مدل رابطه‏ای مقدار کمی (8/0، 6/0 و 4/0) را نسبت داده‏‏اند.

تعیین رتبه گزینه‏ها با توجه به معیار C15 (امنیت): در مدل چندبعدی امنیت داده‏ها در جزیی‏ترین حالت در سطح سلول‏های مکعب چندبعدی است. در صورتی که در مدل رابطه‏ای و برگه‏ای، این امنیت در پایین‏ترین سطح در سطح رکوردهای جداول برقرار است. مقادیر کمی اختصاص داده شده به مدل‏ها برای این معیار (6/0، 4/0 و 2/0)، ‌(1، 9/0 و 7/0) و (6/0، 4/0 و 2/0) برای مدل‏های رابطه‏ای، چندبعدی و برگه‏ای می‏باشد.

 

 

جدول (9): قابلیت برنامه‌نویسی

 

مدل‏های پایگاه داده تحلیلی

برگه‏ای (استفاده آن‏ها در مدل‏های

برگه‏ای رایج نیست)

رابطه‏ای

چندبعدی (توسعه مختص مدل‏های چندبعدی)

زبان‏های برنامه‏نویسی

- XMLA

- ASSL

- ADOMD.NET

- MSOLAP

- AMO

- Windows PowerShell for AMO

- XML

- ADO.NET

- XMLA

- ASSL

- ADOMD.NET

- MSOLAP

- AMO

- Windows PowerShell for AMO

 

 

3-2- اهمیت معیارها و تشکیل ماتریس A

در این بخش به عنوان مطالعه موردی، 6 متخصص خبره، با توجه به سابقه و شناخت گسترده‏ای که از سازمان دارند، اهمیت هر معیار را با توجه به فعالیت‏های تعیین اهمیت معیارها و تشکیل ماتریس A فعالیت شکل (3) و طبق نیازهای سازمان معین می‏کنند. نیازهای سازمان به منظور ایجاد پایگاه داده تحلیلی در جدول (10) آورده شده است.

تعیین میزان اهمیت معیارها توسط سازمان به شکل سلسله مراتبی انجام شده است. برای مثال برای تعیین میزان اهمیت معیار C2، این سازمان نیاز به تعریف سلسله مراتب استاندارد، والد- فرزند زیاد و سرعت در بازیابی آن‏ها بنا به ماهیت تحلیل‏های سازمان دارد.

بنابراین، با توجه به سلسله مراتب‏های استاندارد، والد-فرزند و ناهموار موجود و نیاز سازمان به سلسله مراتب‌های استاندارد و والد- فرزند، این دو معیار با توجه به جدول (1) و طبق نظر یکی از متخصصان کمیته (متخصص اول)، مقدار کمی (1، 1 و 7/0) یعنی بسیار بالا و معیار سلسله مراتب ناهموار نیز بنا به عدم نیاز سازمان به این معیار، مقدار کمی (3/0، 0 و 0) و یا به بیان کیفی اهمیت بسیار کم را می‏گیرد که میانگین این سه ریز معیار مقدار کمی ‍‍(66/0، 66/0 و 46/0) می‏باشد.

 

3-3- تشکیل ماتریس F وتصمیم‏گیری

میانگین نظرات 6 خبره تصمیم‏گیرنده که طبق مقادیر فازی جدول (2) در 3-1 محاسبه شد (برای تشکیل ماترس R در (6)) در جدول (11) آورده شده است.

همان طور که در جدول (12) آمده است، میزان اهمیت معیارها با توجه به نیازهای سازمان و واژه‏های بیان شده در جدول (1) و نیز سلسله مراتب معیارها محاسبه شده است.

در انتها برای تصمیم‏گیری جهت ایجاد پایگاه داده تحلیلی بر اساس نیاز سازمان، مقادیر ماتریس F (بیان شده در جدول (8)) در جدول (9) وارد می‏شوند.

 

 

4- ارزیابی و مقایسه نتایج

4-1- نتایج روش تصمیم‏گیری چند معیاره فازی

همان طور که در نمودار فعالیت شکل(3) آورده شد، در نهایت خروجی این ساختار ماتریسF  است که برای تحلیل نتایج و تصمیم‏گیری نهایی استفاده خواهد شد.  هر مدل بر اساس های محاسبه شده در جدول (9) برای رتبه‏بندی مدل‏ها محاسبه شده و در شکل (5) آورده شده است.  بر اساس مقادیر به دست آمده و با هدف ماکسیمم بودن تابع هدف، مدل برگه‏ای ( ) بیش‏ترین مقدار  را کسب کرده و مناسب‏ترین مدل داده برای انتخاب با توجه به نیاز سازمان است.

 

 

 

 

4-2- نتایج روش تحلیل سلسله مراتبی فازی

در میان روش‏هایی که در مجموعه روش‏های تصمیم‌گیری چند معیاره قرار می‏گیرند، روش
 Fuzzy AHP به دلیل قابلیت سازگاری و فراهم کردن امکان مقایسات زوجی نتایج دقیق‏تری تولید می‏کند.

به علت‏ اینکه در فرآیند Fuzzy AHP، وزن‏دهی به گزینه‏ها با مقایسه زوجی گزینه‏ها نسبت به هدف انجام می‏شود و همچنین گزینه‏ها نسبت به تک تک معیارها مورد مقایسه زوجی، ارزیابی و امتیازدهی قرار می‏گیرند، این روش از کارایی مناسبی برخوردار بوده و نتایج نهایی از دقت و اطمینان بالایی برخوردار است.

Fuzzy AHP رویکردی است که در آن مسأله به یک ساختار سلسله مراتبی متشکل از معیارهای تصمیم‏گیری تجزیه می‏شود که در آن وابستگی معناداری بین زیرمعیارها وجود ندارد.

 

 

جدول (10): نیازهای سازمان

نیازهای سازمان

معیار

نیازهای سازمان برای ایجاد پایگاه داده تحلیلی

اهمیت سرعت زمان چرخه توسعه مدل

C1

نیاز‏های سازمان

لزوم تعریف زیاد سلسله مراتب‏های استاندارد و والد- فرزند

 در نتیجه نوع تحلیل‏های سازمان و سرعت در بازیابی آن‏ها

C2

Stored Procedured , Actions, Perspective

C3

نیاز به انجام حدود 60 درصد از پرس و جوهای منبع داده که ساده هستند.

C4

نیاز به انجام حدود 40 درصد از پرس و جوهای منبع داده که پیچیده هستند.

C5

استفاده از توابع تجمیعی معمول ( Sum، Min، Max، Count) در پردازش‏ها

C6

عدم نیاز به نظارت و  در نتیجه عدم نیاز به استفاده از شاخص‏های عملکردی

C7

عدم نیاز به تبدیلات نرخ ارز

C8

قابلیت ذخیره رکوردها در میزان گیگابایت در سیستم

C9

کارائی و سرعت معمول در بازیابی پرسش‏ها

C10

ایجاد از روی منابع داده رابطه‏ای Microsoft Sql Server

C11

ذخیره‏سازی در حافظه

C12

گزارش‏گیری توسط ابزار کاربریExcel

C13

عدم نیاز به مدیریت اشیاء بواسطه سایر محیطها

C14

نیاز به حداقل امنیت منبع داده به میزان امنیت سطرها

C15

 

 

 

جدول (11): میانگین نظرات متخصصان کمیته برای رتبه‏بندی مدل‏ها

میانگین نظرات متخصصان کمیته برای مدل رابطه‏ای

میانگین نظرات متخصصان کمیته برای مدل چندبعدی

میانگین نظرات متخصصان کمیته برای مدل برگه‏ای

معیار

(95/0، 81/0، 61/0)

(1، 3/0، 1/0)

(9/0، 73/0، 53/0)

C1

(7/0، 51/0، 31/0)

(1، 93/0، 73/0)

(9/0، 7/0، 5/0)

C2

(8/0، 6/0، 4/0)

(1، 9/0، 7/0)

(75/0، 55/0، 35/0)

C3

(9/0، 73/0، 53/0)

(8/0، 6/0، 4/0)

(1، 83/0، 63/0)

C4

(35/0، 18/0، 05/0)

(1، 9/0، 7/0)

(9/0، 7/0، 5/0)

C5

(5/0، 3/0، 1/0)

(1، 93/0، 6/0)

(85/0، 65/0، 45/0)

C6

(18/0، 18/0، 05/0)

(1، 9/0، 7/0)

(95/0، 78/0، 58/0)

C7

(41/0، 21/0، 05/0)

(1، 93/0، 6/0)

(33/0، 13/0، 0)

C8

(41/0، 35/0، 15/0)

(1، 93/0، 6/0)

(85/0، 65/0، 45/0)

C9

(5/0، 3/0، 1/0)

(1، 9/0، 7/0)

(1، 1، 8/0)

C10

(73/0، 71/0، 38/0)

(41/0، 21/0، 05/0)

(9/0، 76/0، 56/0)

C11

(6/0، 35/0، 15/0)

(1، 9/0، 7/0)

(1، 96/0، 76/0)

C12

(95/0، 81/0، 61/0)

(1، 88/0، 66/0)

(1، 86/0، 66/0)

C13

(8/0، 6/0، 4/0)

(1، 9/0، 7/0)

(85/0، 65/0، 45/0)

C14

(6/0، 4/0، 2/0)

(1، 9/0، 7/0)

(6/0، 4/0، 2/0)

C15

 

جدول (12): تعیین میزان اهمیت معیارها بر اساس نیاز سازمان

معیارها

خبره اول

خبره دوم

خبره سوم

خبره چهارم

خبره پنجم

خبره ششم

میانگین نظرات

C1

(1، 1، 7/0)

‍‍(7/0، 9/0، 63/0)

‍‍(86/0، 66/0، 36/0)

‍‍(93/0، 73/0، 46/0)

‍‍(93/0، 83/0، 53/0)

‍‍(1، 9/0، 63/0)

‍‍(90/0، 83/0، 55/0)

C2

‍‍(66/0، 66/0، 46/0)

‍‍(83/0، 38/0، 46/0)

‍‍(83/0، 56/0، 33/0)

‍‍(76/0، 66/0، 46/0)

‍‍(93/0، 83/0، 53/0)

‍‍(76/0، 56/0، 4/0)

‍‍(79/0، 60/0، 44/0)

C3

‍‍(71/0، 6/0، 35/0)

‍‍(8/0، 66/0، 43/0)

‍‍(68/0، 43/0، 28/0)

‍‍(68/0، 55/0، 35/0)

‍‍(71/0، 6/0، 35/0)

‍‍(65/0، 4/0، 28/0)

‍‍(54/0، 63/0، 34/0)

C4

‍‍(55/0،25/0، 0)

‍‍(9/0، 6/0، 35/0)

‍‍(9/0، 6/0، 35/0)

‍‍(9/0، 6/0، 35/0)

‍‍(1، 7/0، 5/0)

‍‍(1، 85/0، 6/0)

‍‍(87/0، 6/0، 35/0)

C5

‍‍(1، 85/0، 6/0)

‍‍(1، 85/0، 6/0)

‍‍(9/0، 6/0، 35/0)

‍‍(1، 85/0، 6/0)

‍‍(1، 85/0، 6/0)

‍‍(1، 1، 7/0)

‍‍(98/0، 83/0، 57/0)

C6

‍‍(55/0، 36/0، 21/0)

‍‍(68/0، 53/0، 23/0)

‍‍(54/0، 39/0، 21/0)

‍‍(66/0، 45/0، 3/0)

‍‍(66/0، 45/0، 3/0)

‍‍(68/0، 53/0، 23/0)

‍‍(62/0، 45/0، 24/0)

C7

‍‍(5/0،3/0، 0)

‍‍(3/0، 0، 0)

‍‍(5/0، 3/0، 0)

‍‍(8/0، 5/0، 2/0)

‍‍(8/0، 5/0، 2/0)

‍‍(4/0، 15/0، 0)

‍‍(55/0، 29/0، 06/0)

C8

‍‍(3/0، 0، 0)

‍‍(3/0، 0، 0)

‍‍(65/0، 4/0، 1/0)

‍‍(55/0، 25/0، 1/0)

‍‍(55/0، 25/0، 1/0)

‍‍(3/0، 0، 0)

‍‍(44/0، 15/0، 05/0)

C9

‍‍(8/0، 5/0، 2/0)

‍‍(8/0، 5/0، 2/0)

‍‍(8/0، 5/0، 2/0)

‍‍(8/0، 5/0، 2/0)

‍‍(1، 7/0، 5/0)

‍‍(8/0، 5/0، 2/0)

‍‍(83/0، 45/0، 25/0)

C10

‍‍(1، 1، 7/0)

‍‍(93/0، 73/0، 46/0)

‍‍(93/0، 73/0، 46/0)

‍‍(93/0، 73/0، 46/0)

‍‍(1، 1، 7/0)

‍‍(7/0، 4/0، 3/0)

‍‍(91/0، 76/0، 51/0)

C11

‍‍(58/0، 41/0، 11/0)

‍‍(1، 7/0، 5/0)

‍‍(58/0، 41/0، 11/0)

‍‍(8/0، 5/0، 2/0)

‍‍(1، 7/0، 5/0)

‍‍(1، 7/0، 5/0)

‍‍(82/0، 57/0، 32/0)

C12

‍‍(95/0، 72/0، 47/0)

‍‍(9/0، 67/0، 4/0)

‍‍(8/0، 5/0، 2/0)

‍‍(1، 7/0، 5/0)

‍‍(1، 7/0، 5/0)

‍‍(1، 7/0، 5/0)

‍‍(94/0، 66/0، 42/0)

C13

‍‍(72/0، 5/0، 27/0)

‍‍(75/0، 4/0، 1/0)

‍‍(8/0، 5/0، 2/0)

‍‍(72/0، 5/0، 27/0)

‍‍(75/0، 4/0، 1/0)

‍‍(8/0، 5/0، 2/0)

‍‍(75/0، 46/0، 19/0)

C14

‍‍(3/0، 0، 0)

‍‍(3/0، 0، 0)

‍‍(8/0، 5/0، 2/0)

‍‍(8/0، 5/0، 2/0)

‍‍(5/0، 3/0، 0)

‍‍(3/0، 0، 0)

‍‍(5/0، 21/0، 06/0)

C15

‍‍(65/0، 4/0، 1/0)

‍‍(9/0، 6/0، 35/0)

‍‍(3/0، 0، 0)

‍‍(55/0، 25/0، 1/0)

‍‍(65/0، 4/0، 1/0)

‍‍(55/0، 25/0، 1/0)

‍‍(6/0، 31/0، 12/0)

 

 

 

 

 

 

 

 

 

 

 

 

(9)

 

 

 

شکل (5): محاسبه  برای رتبه‏بندی مدل‏ها با روش تصمیم‏گیری چند معیاره فازی پیشنهادی مقاله

 


روش Fuzzy AHP با استفاده از نرم‏افزار
 Expert Choice اجرا شده و برای اطمینان از نتایج روش تصمیم‏گیری چندمعیاره فازی به کار گرفته شده است.

همان طور که در روش تصمیم‏گیری چندمعیاره فازی دیده شد، بیش‏ترین وزن‏ها به معیارهای محاسبات پیچیده، زمان پیاده‏سازی، و کارایی تعلق داشتند. این موضوع با لحاظ کردن مندرجات روش فازی به عنوان ورودی نرم‌افزار Expert Choice  نیز به قرار شکل (6) و (7) تأیید شده و با نتایج روش تصمیم‏گیری چند معیاره فازی مقایسه شده است. بدین ترتیب خروجی حاصل از هر دو روش بیانگر رتبه‏بندی یکسانی برای معیارها و مدل‏های رابطه‏ای، چندبعدی و برگه‏ای است.

 

 

شکل (6):اهمیت معیارها در انتخاب مدل داده‏ای پایگاه داده تحلیلی با روش تصمیم‏گیری چندمعیاره فازی پیشنهادی و
 
Fuzzy AHP

 

 

شکل (7): رتبه‏بندی مدل‏های داده‏ای پایگاه داده تحلیلی با روش تصمیم‏گیری چندمعیاره فازی پیشنهادی و Fuzzy AHP

  

 

5- نتیجه‏گیری

در این مقاله، از روشی ساده و نظام‏مند بر اساس تئوری فازی به منظور کمک در تصمیم‏گیری برای انتخاب از میان چندین جایگزین و بر اساس چندین معیار استفاده شد. کارکرد این روش از طریق مطالعه موردی شرح داده شد و عملکرد آن با روش Fuzzy AHP برای انتخاب مدل مناسب پایگاه داده تحلیلی مقایسه شد.

هر یک از مدل‏های پایگاه داده تحلیلی با توجه به خصوصیات متمایزشان کاربر را قادر خواهند ساخت تا از مزایای متفاوت آن‏ها بهره ببرد. بنابراین هر یک از مدل‏ها، همانطور که در جدول (11) و شکل (6) این مقاله ارایه شد، توانایی متفاوتی در رابطه با معیارهای مختلف دارند.

یکی از علت‏های عدم موفقیت سازمان‏ها در ایجاد پایگاه داده تحلیلی و یا صرف هزینه زیاد و اتلاف زمان در ایجاد آن، عدم تصمیم‏گیری مناسب توسط سازمان، در نیاز به مدل مناسب سازمان است. در این مقاله با بررسی و تعیین معیارهای مربوط به مدل داده پایگاه داده تحلیلی، از روش تصمیم‏گیری چندمعیاره فازی برای انتخاب مدل پایگاه داده تحلیلی از نقطه‏نظرهای پیاده‏سازی، مدل داده، منطق کسب‏و‏کار، دستیابی و ذخیره‏سازی داده و سطح اطمینان مدل بر اساس نیاز سازمان استفاده شد.

با استفاده از پژوهش کمیته‏ای و روش دلفی، 15 معیار توسط خبرگان کمیته برای این تصمیم‏گیری انتخاب شد. در نهایت، بر اساس نتایج حاصل شده و مقایسه آن‏ها با روش Fuzzy AHP در شکل 7، این روش سبب انتخاب مدل داده مناسب بر حسب نیاز سازمان و در نتیجه کاهش هزینه و عدم اتلاف وقت در ایجاد پایگاه داده تحلیلی شد.

در این مقاله، از روش تصمیم‏گیری چند معیاره فازی و روش Fuzzy AHP برای انتخاب مدل داده پایگاه داده تحلیلی استفاده شد. می‏توان از این روش‏ها برای انتخاب محصولات در سایر صنایع نیز استفاده کرد.

استفاده از تئوری مجموعه فازی با توجه به عدم قطعیت نظرات دنیای واقعی منجر به بهبود تصمیم‏ها شد. همچنین، این نتیجه به دست آمد که اعداد فازی مثلثی مجموعه‏سازی، محاسبه و تفسیر نتایج را برای تصمیم‏گیران تسهیل می‏کنند.



[1]تاریخ ارسال مقاله  : 22/5/1393

تاریخ پذیرش مقاله : 10/8/1393

نام نویسنده مسئول : نگین دانشپور

نشانی نویسنده مسئول : ایران – تهران – دانشگاه تربیت دبیر شهید رجایی – دانشکده مهندسی برق و کامپیوتر



[1] Data Warehouse (DW)

[2] Data model

[3] Fuzzy Multi-criteria Decision Making (FMDM)

[4] Fuzzy Analytical Hierarchy Process (Fuzzy AHP)

[5] Decision Support System (DSS)

[6] Enterprise Resource Planning (ERP)

[7] Relational

[8] Multidimensional

[9] Tabular

[10] Triangular fuzzy numbers

[11] Membership function

[12] Operational Database (DB)

[13] Extraction, Transformation and Loading (ETL)

[14] Subject

[15] Cube

[16] Measures

[17] Dimension

[18] Multidimensional Online Analytical Processing (MOLAP)

[19] Relational Online Analytical Processing (ROLAP)

[20] Multidimensional Expressions (MDX)

[21] Data Analysis Expressions (DAX)

[22] Bussiness Intelligence (BI)

[23] Ragged

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 
[1]      Figueira J., Greco S., and Ehrgott M., Multiple Criteria Decision Analysis: State of the Art Surveys Series, Springer New York, 2005.
[2]      Daneshpour N., Abdollahzadeh barforoush A., “ AUT-QPM: The New Framework to Query Evaluation for Data Warehouse Creation”, Iranian Journal of Electrical and Computer Engineering  (persian), Vol. 6, No. 1, pp. 35-45, 2008.
[3]      Lan H. E., Congbo L. I., “Method for selecting ERP system based on fuzzy set theory and analytical hierarchy process”, IEEE Computer Society, Vol. 1, pp. 329-332, 2009.
[4]      Chang D. Y., “Extent analysis and synthetic decision, Optimization Techniques and Applications”, World Scientific, Vol. 1, pp. 352-355, 1992.
[5]      Hwang C. L., Yoon K., Multiple Attribute Decision Making: Methods and Application, Springer-Verlag, 1981.
[6]      Zimmermann H. J., Fuzzy Set Theory-And Its Applications, Kluwer Academic Press, 1991.
[7]      Vijayalakshmi S., Zayaraz G., Vijayalakshmi V., “Multicriteria decision analysis method for evaluation of software architectures”, International Journal of Computer Applications, Vol. 1, No. 25, pp. 22–27, 2010.
[8]      Cochran J. K., Chen H., “Fuzzy multi-criteria selection of object-oriented simulation software for production system analysis”, Computers & Operations Research, Vol. 32, No. 1, pp. 153–168, 2005.
[9]      Eldrandaly K., Naguib S., “A knowledge-based system for GIS software selection”, International Arab Journal of Information Technology, Vol. 10, No.2, pp. 152-159, 2013.
[10]      LeBlanc P., Louis A., and Jelassi T., “DSS software selection: a multiple criteria decision methodology”, Information & Management, Vol. 17, No. 1, pp. 49–65, 1989.
[11]      Mamaghani F., “Evaluation and selection of antivirus and content filtering software”, Information Management and Computer Security, Vol. 10, No. 1, pp. 28–32, 2002.
[12]      Phillips-Wren G. E., Hahn E. D., Forgionne G.A., “A multiple-criteria framework for evaluation of decision support systems”, Omega International Journal of Management Science, Vol. 32, No. 4, pp. 323–332, 2004.
[13]      Huang H., Cheng H., Wang Q.I., and Shao Y., “A research of the implementation readiness model for ERP”, 6th International Conference on E-Business, Wuhan, pp. 341-347, 2007.  
[14]      Lien, C. T., Chan H. L., “A Selection Model for ERP System by Applying Fuzzy AHP Approach”, International Journal of The Computer, the Internet and Management, Vol. 15, No. 3, pp. 58-72, 2007.
[15]      Lin H. Y., Hsu P. Y., Sheen G. J., “A fuzzy-based decision-making procedure for data warehouse system selection”, Expert Systems with Applications, Vol. 32, No. 3, pp. 939–953, 2007.
[16]      LeBlance P., Microsoft SQL Server 2012 Step by Step, Microsoft Press, 2013.
[17]      Kimball R., Ross M., The Data Warehouse Toolkit: the Complete Guide to Dimensional Modeling, Wiley Publishing, 2002.
[18]      Chen S. H., “Ranking fuzzy numbers with maximizing set and minimizing set”, Fuzzy Sets and Systems, Vol. 17, No. 2, pp. 113–129, 1985.
[19]      Zadeh L. A., “Fuzzy sets”, Information and Control, Vol. 8, No. 3, pp. 338–353, 1965.
[20]      Liang G. S., Wang M. J. J., “A fuzzy multi-criteria decision making approach for robot selection”, Robotics and Computer-Integrated Manufacturing, Vol. 10, No. 4, pp. 267–274, 1993.
[21]      Pressman R., Software Engineering: A Practitioner’s Approach, McGraw-Hill Publishing, 2009.
[22]      Azar A., and Faraji H., Elme modiriyyate Fuzzy, Iran Management & Productivity Study Center, Ejma Publishing, 1390.
[23]      Chang P. T., “The fuzzy delphi method via fuzzy statistics and membership function fitting and application to the human resources”, Fuzzy Sets and Systems, Vol. 112, No. 3, pp. 511-520 , 2000.
[24]      Clemen T. R., Reilly T., Making hard decisions with decision tools, Pacific Groce, CA: Duxbury Press, 2001.
[25]      Russo M., Ferrari A., and Webb C., Microsoft SQL Server 2012 Analysis Services: The BISM Tabular Model, Microsoft Press, 2012.
[26]      Xidonas P., Mavrotas G., Psarras J., “A multicriteria decision making approach for the evaluation of equity portfolios”, International Journal of Mathematics in Operational Research, Vol. 2, No.1, pp. 40 – 72, 2010.
[27]      Mahapatra S. S., “Supplier selection in supply chain management: a fuzzy multi-criteria decision-making approach”, International Journal of Services and Operations Management, Vol. 8, No. 1, pp. 108 – 126, 2011.
[28]      Morankar D. V., “Performance evaluation of irrigation network using fuzzy multicriterion group decision making technique”, International Journal of Hydrology Science and Technology, Vol. 3, No. 1, pp. 13 – 29, 2013.
[29]      Das M. C., Sarkar B., Ray S., “Comparative evaluation of indian technical institutions using fuzzy AHP and MOORA”, International Journal of Multicriteria Decision Making, Vol. 2, No. 1, pp. 74 – 93, 2012.