Authors
1 Electric Energy Systems Planning and Operation Group, Department of Electrical Engineering, Abbaspour School of Engineering, Shahid Beheshti University, Tehran, Iran
2 Abbaspour School of Engineering, Shahid Beheshti University, Tehran, Iran
Abstract
Keywords
Main Subjects
افزایش روزافزون نفوذ واحدهای بادی در سیستمهای قدرت، تغییرات اساسی در تصمیمات برنامهریزی و بهرهبرداری سیستمهای قدرت را موجب میشود؛ بنابراین، اطلاع از میزان تولید واحدهای بادی، عامل بسیار مهمی در بهبود تصمیمگیری خواهد شد؛ اما از سوی دیگر، با توجه به نیاز فزاینده به منابع انرژی در اثر اجرای سیاستهای توسعۀ اقتصادی و افزایش جمعیت جهانی و نیز کمیابی منابع سوختهای فسیلی و خطرات زیست محیطی ناشی از این سوختها، اهمیت توجه به سیاستگذاری و مدیریت انرژی را دوچندان میکند [1]. در این زمینه رویکردهای مختلفی همچون کاهش مصرف انرژی با اجرای سیاستهای صرفهجویی انرژی و افزایش کارآیی انرژی و همچنین استفاده از منابع انرژی تجدیدپذیر وجود دارند [2]. فناوریهای انرژی تجدیدپذیر باوجود مسائلی همچون تناوب در تولید انرژی و هزینۀ نگهداری زیاد، مزایای فراوانی دارند که رقابتپذیری آنها را در مقایسه با رقبای سنتی خود کمتر میکند. کاهش وابستگی به منابع سوخت فسیلی، کاهش آلودگیهای زیستمحیطی و گازهای گلخانهای و نبود مسائل ایمنی مرتبط با انرژی اتمی [3] توجیه مناسبی است تا این منابع از دید اجتماعی از اقبال گستردهای برخوردار باشند [4]. با وجود این، انتخاب نوع فناوری انرژی تجدیدپذیر نیز تصمیم مهمی است؛ به گونهای که برخی پژوهشگران به بررسی و اولویتبندی انواع مختلف فناوری تولید انرژی تجدیدپذیر پرداختهاند. ایوانز و همکاران [5] در مطالعهای براساس قابلیت پایداری[1] تکنولوژیهای عمدۀ تولید انرژی تجدیدپذیر ارزیابی کردهاند. ایشان منابعی همچون انرژی بادی، برقآبی، فتووالتائی و زمینگرمایی را براساس بهای انرژی تولیدی، انتشار گازهای گلخانهای، سهولت دسترسی، کارایی تبدیل انرژی، مساحت مورد نیاز، مصرف آب و اثرات اجتماعی ارزیابی و مقایسه کردهاند. نتایج مطالعه نشان دادند انرژی بادی باوجود نیاز به مساحت و سرمایۀ زیاد، کمترین میزان آلودگی و مصرف آب و اثرات اجتماعی مطلوبی دارد. بر اساس این، انرژی بادی سهم عمدهای در میان انرژیهای تجدیدپذیر داشته و اخیراً نفوذ چشمگیری در بازار برق کشورهای مختلف داشته است؛ به گونهای که گزارش شورای جهانی انرژی بادی[2] ظرفیت انرژی بادی از 4/17 گیگاوات در سال 2000 به 587/282 گیگاوات در سال 2012 رسیده است. با وجود این، به دلیل وابستگی انرژی بادی به شرایط متغیر و ناپایدار جوی، میزان عرضۀ آن پرنوسان است؛ بهویژه آنکه سرعت باد در تولید انرژی بادی نقش عمدهای دارد و ممکن است در طی زمان نوسانات شدیدی داشته باشد؛ ازاینرو، عرضهکنندگان و فعالان حیطۀ انرژی بادی به پیشبینیهای دقیق در این زمینه بسیار علاقهمند بودهاند و سعی میکنند به کمک ابزار پیشبینی مناسب با سایر نیروگاههای شبکه هماهنگ شوند و از هزینههای تولید مازاد خودداری کنند؛ ازاینرو، اهمیت پیشبینی دقیق انرژی بادی در مزارع بادی روزبهروز در حال افزایش است [6]. در این بین، پیشبینی کوتاهمدت انرژی بادی برای کاهش هزینۀ مقادیر رزروشده (به منظور قابلیت اطمینان سیستم) و افزایش درآمد ژنراتورهای بادی (با ارائۀ پیشنهادات بهینه در بازار برق) اهمیت فراوانی دارند.
مطالعات مختلف نتایج مطلوبی از پیشبینی انرژی بادی با استفاده از تکنیکهای سریزمانی ارائه میکنند. تکنیکهای خانواده ARIMA یکی از رویکردهای پرکاربرد در این میان است [7] و [8]. این دسته شامل تکنیکهایی همچون AR، MA، ARMA، ARIMA و SARIMA است. باوجود توانایی این رویکرد در ارائۀ فرم تبعی میان ورودی و خروجی، محدودبودن به معادلات خطی از معایب این رویکرد به شمار میرود. در مقابل رویکردهای هوش مصنوعی (AI) و یادگیری ماشینی (ML) به دلیل توانایی بیشتر در مدلسازی روابط غیرخطی توجه پژوهشگران در زمینۀ پیشبینی انرژی بادی را جلب کردهاند. این تکنیکها شامل انواع مختلف شبکههای عصبی ازجمله BP و RBF [9] و [10]، SVM [11] و منطق فازی [12] هستند. در زمینۀ کاربرد تکنیکهای مختلف در پیشبینی انرژی بادی [13] و [14] و [15] و [16] بررسی اجمالی مفیدی ارائه کردهاند. مروری بر نتایج مطالعات مختلف در این زمینه نشان میدهند به دلیل روند غیرخطی و پرنوسان انرژی بادی تکنیکهای غیرخطی بهخصوص شبکههای عصبی نتایج مطلوبی داشتهاند.
با وجود این، شبکههای عصبی استفادهشده در مطالعات مختلف کاستیهایی نیز دارند. در رویکرد سنتی پیش از اقدام به آموزش شبکه لازم است ساختار آن از قبل تعیین شده باشد. از سوی دیگر، نتایج بسیار متفاوتی با تغییر در ساختار پارامترهای شبکه ازجمله مقادیر وزنهای اولیه، تعداد لایههای پنهان و تعداد نرونها در لایۀ پنهان در مرحلۀ آموزش شبکه حاصل میشوند. همچنین چرخههای تکراری زیادی با ساختارهای مختلف لازم است تا ساختار دقیق شبکه مشخص شود؛ ازاینرو، شبکۀ عصبی GMDH برای غلبه بر کاستیهای فوق ارائه شده است.
شبکۀ عصبی GMDH براساس فرآیند خودسازماندهی و ارزیابی دادهها بهصورت جداگانه با استفاده از معیار خارجی[3] برای مدلسازیهای پیچیده کاربرد دارد. در این الگوریتم، متغیرهایی تأثیرگذار بر فرآیند بهعنوان ورودی شبکه استفاده میشوند. این الگوریتم با بررسی و کشف روابط بین آنها و آزمون مدلهای پیشنهادی بهطور هوشمند، مدل بهینهای را ارائه و متغیر خروجی را پیشبینی میکند. بر اساس این، الگوسازیهای بهکاررفته در این مطالعه مبتنی بر دو روش هوش مصنوعی و نظریۀ اطلاعات است؛ به گونهای که در الگوریتم پیشنهادی ابتدا متغیرهای مؤثر براساس اطلاعات متقابل (MI) و به کمک الگوریتم ترکیبی انبوهذرات و ژنتیک (PSO-GA)، انتخاب و سپس در موتور پیشبینی به کار گرفته میشوند. برخلاف روش ارتباط متقابل[4] در رویکرد استفادهشده، (Cross entropy) روابط غیرخطی میان متغیرها در نظر گرفته میشود و انتخاب متغیرهای مؤثر در پیشبینی انرژی بادی که در آن نوسانات و روند غیرخطی مشاهده میشود، با دقت و اعتبار بیشتری انتخاب میشود.
در ادامه ابتدا به تشریح روش انتخاب متغیرهای مؤثر و تکنیک شبکۀ عصبی GMDH پرداخته و سپس الگوریتم پیشنهادی بهمنظور پیشبینی انرژی بادی ارائه میشود.
در این بخش مختصری از نظریۀ اطلاعات و مفاهیم مربوط به آن، ارائه و درنهایت بهمنظور انتخاب متغیرهای مؤثر تابعی مبتنی بر آن ارائه میشود. نظریۀ اطلاعات به نظریۀ ریاضی ارتباطات معروف است و با ویژگیهایی چون قلمرو فوقالعاده کلی، برخورد اصولی و پایهای با مسائل و مشکلات و سادگی و استحکام نتایج بهبارآورنده توصیف شده است [17].
نظریۀ ریاضی ارتباطات، بهمنزلۀ پایۀ نظریۀ اطلاعات ازسوی کلودشانون در سال 1948 ارائه شد. این نظریه راهحلی بود برای مسئلۀ فرستادن حداکثر مقدار اطلاعات از مجرای معین و اندازهگیری ظرفیت مجرا برای حمل اطلاعات.
در نظریۀ اطلاعات حشو[5] و آنتروپی دو مفهوم رایج بهشمار میروند. حشو، متضاد آنتروپی است که به پیشبینیپذیری یا قراردادیبودن پیام دلالت دارد. درواقع، حشو نتیجۀ پیشبینیپذیری زیاد است؛ در حالی که آنتروپی نشانۀ پیشبینیپذیری اندک است؛ بنابراین پیامی با پیشبینیپذیری اندک دارای آنتروپی و «اطلاعات» بسیار است. برعکس، پیامی با پیشبینیپذیری زیاد، حشو بسیار و «اطلاعات» اندک دارد؛ بنابراین آنتروپی، به تصادفیبودن یا نبود سازمان (نظم) در یک موقعیت گفته میشود. هرچه میزان پیشبینی در پیام کمتر شود، میزان آنتروپی آن افزایش مییابد.
بر اساس این، در زمینۀ پیشبینی سریهای زمانی نیز به کمک نظریۀ اطلاعات از میان انبوهی از متغیرهای متنوع تنها تعداد محدود و مؤثری از آنها بهعنوان متغیر توضیحی استفاده میشوند. در این زمینه برخی مطالعات به کمک معیار اطلاعات متقابل (MI[6]) به انتخاب ویژگی پرداختهاند. سایمون و ورلیسن (2007) بهمنظور انتخاب وقفه بهینۀ سری زمانی، استفاده از ابزار اطلاعات متقابل را پیشنهاد میکنند [18]. همچنین فرانسوا و همکاران (2007) در مطالعهای با ترکیب معیار اطلاعات متقابل و استراتژی انتخاب ویژگی روبهجلو[7] سعی در ارائۀ راهحلی بهینه میان مجموعه ویژگیهای (متغیرهای) انتخابشده و زمان محاسبه داشتند [19]. مِی و همکاران (2008) در مطالعهای بهمنظور پیشبینی کیفیت آب میان سیستمهای توزیع آب از معیار اطلاعات متقابل در انتخاب متغیرهای ورودی شبکۀ عصبی بهره بردند [20]. امجدی و داراییپور (2009) در مطالعۀ خود بهمنظور پیشبینی قیمتهای آتی در بازار برق با استفاده از شبکۀ عصبی آبشار از معیار اطلاعات متقابل برای انتخاب متغیرهای ورودی شبکه استفاده کردند [21]. امجدی و کینیا (2011) در مطالعهای دیگر بهمنظور پیشبینی قیمت برق با استفاده از شبکههای عصبی احتمالی و ترکیبی از معیار اطلاعات متقابل در انتخاب مجموعه متغیرهای مؤثر ورودی شبکه استفاده کردند [22]. امجدی و همکاران (2011) در مطالعهای در زمینۀ پیشبینی انرژی بادی به کمک شبکۀ عصبی ریجلت از معیار اطلاعات متقابل بهمنظور انتخاب متغیرهای ورودی شبکه بهره بردند [23]. کینیا (2012) در مطالعهای به کمک شبکۀ عصبی مرکب و معیار اطلاعات متقابل به پیشبینی قیمت برق پرداخت. کاظم و همکاران (2013) بهمنظور پیشبینی شاخص سهام نزدک، بانک جهانی و مایکروسافت با استفاده از شبکههای عصبی مختلف به انتخاب متغیرهای ورودی شبکه به کمک اطلاعات متقابل پرداختند [24].
در این مطالعه نیز براساس نظریۀ اطلاعات و به کمک تابع آنتروپی متقابل (CEF) متغیرهای مؤثر، ورودی شبکههای عصبی انتخاب میشود. این تکنیک نهتنها در انتخاب انوع متغیرهای مؤثر (سرعت و جهت باد)، در انتخاب وقفههای متغیر هدف و متغیرهای ورودی راهگشا خواهد بود. تحلیلهای مبتنی بر رویکرد پیشنهادی نهتنها همانند تابع همبستگی متقابل (CCF) روابط خطی را در انتخاب متغیرهای مؤثر لحاظ میکند، روابط غیرخطی میان آنها را نیز لحاظ میکند.
اطلاعات متقابل دو متغیر پیوستۀ تصادفی x و y با MI(y,x) نشان داده میشوند که مبتنی بر تابع چگالی احتمال مشترک آنها P(y,x) و همچنین تابع چگالی احتمال تکتک آنها P(x) وP(y) است [25]:
(1) |
رابطۀ فوق چنانچه متغیرهای مورد بحث گسسته باشند، بهصورت زیر خواهد بود [26]:
(2) |
بنابراین متغیرهای در مرحلۀ انتخاب ویژگی براساس رویکرد گسستهسازی چهارکی[8] به متغیر گسسته تبدیل میشوند. تبدیل و گسستهسازی متغیرهای حقیقی به نوعی از دادهها با مقادیر محدود، بیشتر در الگوریتمهای یادگیری ماشینی ضروری است [27].
آنتروپی شرطی[9] متغیر تصادفی گسسته Y با فرض رخداد بهصورت زیر خواهد بود [26]:
(3) |
که در آناحتمال با فرض رخداد است. آنتروپی شرطی Y در صورت معین بودن X نیز بهصورت زیر خواهد بود [26]:
(4) |
که نشاندهندۀ عدمقطعیت دربارۀ Y در صورت مشخصبودن تمام رخدادهای X است و فرم مناسب برای آن بهصورت زیر خواهد بود [26]:
(5) |
در رابطۀ فوق H(X,Y) بهصورت زیر محاسبه میشود که نشاندهندۀ آنتروپی مشترک X و Y است [26]:
(6) |
بهطورکلی آنتروپی شرطی Y در قبال متغیرهای توضیحی بهصورت زیر خواهد بود [26]:
(7) |
در صورتی که ارزش عددی رابطۀ فوق برابر با صفر باشد، به این معنی خوهد بود که متغیرهای توضیحی کاملاً به توضیح تغییرات متغیر هدف (Y) قادرند [28].
همانطور که گفته شد در این مطالعه بهمنظور یافتن همبستگی (خطی و غیرخطی) میان متغیرهای ورودی و متغیر هدف از تابع آنتروپی متقابل استفاده شده است. هدف این تکنیک انتخاب وقفههای بهینۀ مدل پویا در کنار انتخاب هر متغیر مؤثر است. بر اساس این، ابتدا لازم است مختصری دربارۀ تابع همبستگی متقابل توضیح داده شود.
تابع همبستگی متقابل براساس ضریب همبستگی پیرسون r بنا شده است که این ضریب درجۀ همبستگی میان دو متغیر تصادفی را مبتنی بر انطباق خطی دادهها نشان میدهد. این ضریب مقداری بین 1- تا 1+ میپذیرد؛ بهگونهای که مقدار 1+ نشاندهندۀ همبستگی مثبت کامل خطی و مقدار 1- همبستگی منفی کامل خطی را نشان میدهد و مقدار 0 برای این ضریب نشان میدهد دو متغیر بررسیشده هیچ ارتباط خطی باهم ندارند. با وجود این، در چنین شرایطی احتمال وجود روابط غیرخطی وجود خواهد داشت.
رابطۀ زیر نحوۀ محاسبۀ این ضریب میان دو متغیر با N مشاهده را نشان میدهد [29]:
(8) |
در رابطۀ فوق و مقادیر اندازگیریشدۀ متغیرهای تصادفی x و y بودهاند و و نیز میانگین آنها هستند. بر اساس این، برای هر متغیر و وقفۀ آن ضریب پیرسون محاسبه شده است و برای یافتن مؤثرترین آنها، متغیرهایی با بیشترین ضریب پیرسون انتخاب خواهد شد. با وجود این، همانگونه که گفته شد این ضریب تنها براساس روابط خطی محاسبه شدهاند و بنابراین در مواجه با سیستمهای غیرخطی کاستیهایی دارند. برای غلبه بر این کاستیها در این مطالعه تکنیک مناسبی برای تحلیل سیستمهای غیرخطی ارائه شده است. رابطۀ زیر نشاندهندۀ اطلاعات متقابل نرمالشده میان دو سری زمانی X و Y است [26]:
(9) |
در رابطۀ فوق پارامتر R مقداری بین 0 و 1 میپذیرد و نشاندهندۀ میزان اطلاعاتی دربارۀ متغیر هدف است که با متغیر ورودی توضیح داده میشود. بر اساس این، چنانچه متغیر X کلیۀ اطلاعات ضروری برای پیشبینی Y را دارا باشد، در این صورت برابر با صفر میشود و درنتیجه R برابر 1 خواهد بود. از سوی دیگر، چنانچه متغیر X هیچ اطلاعاتی از متغیر Y را در بر نداشته باشد،برابر با میشود و درنتیجه R برابر با 0 خواهد بود [30].
تابع اطلاعات متقابل ارائهشده در رابطه (9) برای هر متغیر و وقفههای آن محاسبه میشود و به دنبال آن، متغیرهایی که دارای مقدار بیشتری برای این تابع باشند، متغیر مؤثر انتخاب خواهند شد. این رویکرد برای انتخاب هر متغیر و وقفه بهینۀ آن بهطور مستقل و بدون توجه به وابستگی میان آنها نتایج مطلوبی خواهد داشت.
در این رویکرد چنانچه وقفۀ انتخابی مثبت باشد، نشاندهندۀ پویایی سیستم و ارتباط مقادیر فعلی متغیر هدف با مقادیر گذشته متغیر توضیحی است. چانچه متغیر بدون وقفه انتخاب شود، نشاندهندۀ سیستم ایستا است و در صورتی که وقفۀ پیشنهادی منفی باشد، نشاندهندۀ رابطۀ علیت معکوس خواهد بود. بدین صورت که مقادیر فعلی متغیر هدف بر مقادیر آتی متغیر ورودی اثرگذار است.
همانگونه که مشاهده میشود در رابطه (9) همبستگی میان متغیرهای ورودی در نظر گرفته نشده است؛ بنابراین براساس اصول حداکثر ارتباط و حداقل حشو مسئلۀ بهینهیابی چندهدفۀ زیر برای جلوگیری از حشو در انتخاب مؤثرترین ورودیهای سیستم استفاده میشود [30]:
(10) |
|
(11) |
در روابط فوق V و P بهصورت زیر محاسبه میشوند:
(12) |
|
(13) |
در روابط فوق نیز نشاندهندۀ اطلاعات مشترک میان دو متغیر تصادفی a و b است. اجرای اصل حداکثر ارتباط، مبتنی بر انتخاب متغیرها و وقفههایی از آنهاست که رابطه (10) را حداکثر کنند؛ به این صورت که در که در آن ورودی i ام و Y خروجی سیستم است، باید میانگین اطلاعات متقابل کلیۀ ورودیها افزایش یابد. اجرای اصل حداقل حشو نیز مبتنی بر انتخاب متغیرها و وقفههایی از آنهاست که رابطه (11) را حداقل کنند؛ به این صورت که در که در آن و متغیرهای ورودیاند، باید میانگین اطلاعات متقابل کلیۀ ورودیها کاهش یابد.
بهمنظور یافتن پاسخ بهینۀ مسئلۀ فوق در الگوریتم بهینهیابی با فرض میتوان آن را بهصورت مسئله حداقلسازی زیر در نظر گرفت [26]:
(14) |
حداقلسازی رویکرد مناسب برای حداکثرسازی رابطه (10) و حداقلسازی رابطه (11) است.
باید توجه داشت انتخاب متغیرهای مؤثر از میان n متغیر با وقفههای t=0,1,…,k بسیار زمانبر است. در چنین شرایطی متغیر کاندید وجود خواهد داشت که با در نظر گرفتن جایگشتهای مختلف آنها فضای جستجو برابر با خواهد بود؛ ازاینرو در چنین مسئلهای استفاده از الگوریتمهای تکاملی برای جستجوی فضای بسیار گسترده مسئلۀ ضروری است.
همانگونه که در بخش قبل بیان شد جستجوی متغیرهای مؤثر در فضای بسیار گسترده، ابزار بهینهیابی مناسبی را میطلبد؛ بنابراین در این بخش به معرفی الگوریتم ترکیبی انبوه ذرات و ژنتیک بهبودیافته پرداخته میشود. الگوریتم ژنتیک و الگوریتم انبوه ذرات هردو از الگوریتمهای جمعیت محورند که قدرت آنها در حل مسائل بهینهیابی بسیار دشوار به اثبات رسیده است [31]. با وجود این، دو مدل برجستگیها و کاستیهای خاص خود را دارند. الگوریتم انبوه ذرات ازنظر مفهومی بسیار ساده و ازنظر پیادهسازی تنها در چند خط، کد میشوند. الگوریتم انبوه ذرات همچنین برخلاف الگوریتم ژنتیک دارای حافظهاند؛ در حالی که در الگوریتم ژنتیک چنانچه ذرهای برای نسل بعد انتخاب نشود، خاطرات آن کلاً محو خواهد شد. در الگوریتم انبوه ذرات فعل و انفعالات مشترک و همکاری گروه، بهبود جستجو برای یافتن پاسخ بهینه را موجب میشود؛ در حالی که الگوریتم ژنتیک در یافتن پاسخ دقیق با مشکل مواجه است، در یافتن بهینۀ سراسری عملکرد مناسبی دارد [32].
با وجود این، بدون عملگر انتخاب الگوریتم انبوه ذرات ممکن است منابع محاسباتی را روی ذراتی به هدر دهد که ازنظر پاسخ مسئلۀ ضعیف ارزیابی میشوند و در ناحیۀ نامناسبی قرار دارند. مقایسه میان هردو الگوریتم ژنتیک و انبوه ذرات با [33] و [34] انجام شده است و درنهایت هردو مطالعه پیشنهاد کردهاند ترکیبی از الگوریتم ژنتیک و انبوه ذرات استاندارد به استراتژی جستجوی کارآمدتری منجر خواهد شد. الگوریتم انبوه ذرات استاندارد ممکن است انعطاف کافی برای مسائل کاربردی را نداشته باشد؛ بهخصوص زمانی که این مسائل پیچیده، ناسازگار و چندهدفه[10] باشند.
روشهای مختلفی برای ترکیب این دو الگوریتم وجود دارند. یک رویکرد استفاده از تنها یک الگوریتم در مرحلۀ انتخاب و سپس استفاده از عملگرهای الگوریتم دیگر برای ایجاد پاسخهای بهینه است. مطالعه [35] و [36] چنین رویکردی داشته است. رویکرد دیگر در ترکیب این دو الگوریتم تقسیم جمعیت به دو دسته است که در آن برای هر دسته تنها عملگرهای یک الگوریتم اعمال میشود. مطالعه [37] و [38] چنین رویکردی داشتهاند.
شکل (1): نتایج اعمال عملگرهای جابهجایی بر جواب فرضی |
در این مطالعه رویکرد نوینی در ترکیب این دو الگوریتم ارائه شده است؛ به گونهای ضمن اعمال همزمان کلیۀ عملگرهای هردو الگوریتم روی جمعیت، از عملگرهای متناسب با مسئلۀ این مطالعه برای بهبود نتایج نیز استفاده شده است. در این رویکرد عملگرهای درج[11]، تعویض[12] و وارون[13]کردن استفاده شدهاند که کلیۀ این عملگرها را عملگرهای جابهجایی[14] مینامیم.
شکل (1) نتیجۀ اعمال این عملگرها به پاسخ فرضی را نشان میدهد.
همچنین شکل (2) مراحل اجرای الگوریتم ترکیبی ارائهشده در این مطالعه را نشان میدهد. با توجه به شکل (2)، در این تکنیک پس از ایجاد جمعیت اولیه بهترتیب عملگرهای الگوریتم انبوه ذرات و الگوریتم ژنتیک بر کلیۀ افراد اعمال میشوند که فرایند مربوط به هریک پیشتر بحث شد. شرط توقف در این الگوریتم، معیار حداکثر تعداد تکرار و بهبودنیافتن تابع هدف است.
امروزه دیدگاه دیگری به موازات مدلهای سری زمانی در زمینۀ پیشبینی مطرح است. برتری مهم این روشها که به شبکههای عصبی مصنوعی (ANN) معروفاند، نیازنداشتن به اعمال فرضیههای خاص دربارۀ رفتار متغیرها است. شبکههای عصبی مصنوعی از عناصر عملیاتی سادهای ساخته شدهاند که سازوکار آنها از سیستمهای عصبی بیولوژیکی الهام گرفته شده است.
شکل (2): فلوچارت ترکیب الگوریتم انبوه ذرات و ژنتیک
شبکههای عصبی مصنوعی از تعدادی واحد پردازش متصل به هم تشکیل شدهاند که نرون نامیده میشوند.
ساختار شبکۀ عصبی مصنوعی به گونهای است که نرونها در دستههایی که لایه نام دارند، مرتب میشوند. یکی از قابلیتهای شبکۀ عصبی این است که میتوان با داشتن ورودی، شبکه را طوری آموزش داد (یعنی وزنهای نرونها را طوری اختیار کرد) تا خروجی مطلوب به دست آید.
نخستین بار دانشمند اوکراینی بهنام ایواخننکو در سال 1965 شبکۀ عصبی GMDH را معرفی کرد [39]. شبکۀ عصبی GMDH شبکهای خودسازمانده و یکسویه است که از چندین لایه حاصل شده و هر لایه از چندین نرون تشکیل شده است. تمامی نرونها از ساختار مشابهی برخوردارند؛ طوری که دارای دو ورودی و یک خروجیاند و هر نرون با 5 وزن و یک بایاس عمل پردازش را میان دادههای ورودی و خروجی براساس رابطه (15) برقرار میکند [39].
(15) |
در رابطه فوق، که در آن (N) تعداد مشاهدات بوده و وکه در آنها (m) تعداد نرونهای لایۀ قبلی است، وزنها براساس روش حداقل مربعات معمولی (OLS)، محاسبه و سپس بهعنوان مقادیر مشخص و ثابت در داخل هر نرون جایگذاری میشوند. ویژگی بارز این نوع شبکه آن است که نرونهای مرحلۀ قبل و یا لایۀ قبلی عامل مولد تولید نرونهای جدید به تعداد هستند و از میان نرونهای تولیدشده، لزوماً تعدادی حذف میشوند تا بدینوسیله از واگرایی شبکه جلوگیری شود. همچنین نرونهایی که برای ادامه و گسترش شبکه باقی میمانند نیز ممکن است به دلیل ارتباطنداشتن مستقیم یا غیرمستقیم با لایۀ آخر و ایجاد فرم همگرایی شبکه حذف شوند که اصطلاحاً به آنها نرونهای غیرفعال میگویند. معیار حذف و گزینش مجموعهای از نرونها در یک لایه، میانگین مجموع مربع خطاها (MSE) میان خروجی واقعی و خروجی هر نرون است. این معیار برای خروجی نرونjام یعنی () بهصورت رابطه (16) خواهد بود [39]:
(16) |
در رابطۀ فوق است که در آن m تعداد نرونهای گزینششده در لایۀ قبلی است. نگاشتی بین متغیرهای ورودی و خروجی که این نوع از شبکههای عصبی برقرار میکنند، بهصورت تابع غیرخطی ولترا[15] بهصورت رابطه (17) است [40]:
(17) |
ساختاری که برای نرونها در نظر گرفته شده است، بهصورت فرم خلاصهشدۀ دو متغیره درجۀ دوم زیر خواهد بود:
(18) |
ضرایب مجهول در معادله (18) با تکنیک رگرسیونی چنان به دست میآیند که اختلاف بین خروجی واقعی y و مقادیر محاسبهشدۀ، برای هر جفت متغیر ورودیو کمینه شود. مجموعهای از چند جملهایها، با استفاده از معادلۀ (18) است که ضرایب مجهول همۀ آنها، با استفاده از روش حداقل مربعات معمولی (OLS) به دست میآید. برای هر تابع Gi(هر نرون ساختهشده)، ضرایب معادلات هر نرون برای حداقلکردن خطای آن، بهمنظور انطباق بهینۀ ورودیها بر تمام جفت مجموعههای ورودی – خروجی به دست میآیند.
(19) |
در روش پایهای الگوریتم GMDH، تمام ترکیبات دوتایی (نرونها) از n متغیر ورودی ساخته شدهاند و ضرایب مجهول تمامی نرونها با استفاده از روش حداقل مربعات به دست میآیند؛ بنابرایننرون در لایۀ دوم ساخته میشوند که میتوان آنها را به شکل مجموعۀ زیر نمایش داد.
(19) |
از شکل درجۀ دوم تابع بیانشده در معادله (18)، برای هر M ردیف سهتایی استفاده میشود. این معادلات را میتوان به شکل ماتریسی (20) بیان کرد:
(20) |
که در آن A، بردار ضرایب مجهول معادله درجه دو نشان داده شده در معادله (18) است؛ یعنی:
(21) |
و
(22) |
از مقادیر بردارهای ورودی و شکل تابع بهراحتی مشاهده میشود که:
(23) |
روش حداقل مربعات از آنالیز رگرسیون چندگانه، حل معادلات را به شکل معادله (24) به دست میدهد [41]:
(24) |
این معادله بردار ضرایب معادله (18) را برای تمام M مجموعۀ سهتایی ایجاد میکند.
شکل (3) ساختار نمونه از شبکۀ عصبی GMDH را نشان میدهد.
شکل (3): ساختار شبکۀ عصبی GMDH |
در این مطالعه بهمنظور مقایسۀ کارایی عملیاتی روشهای مختلف (ARIMA، MLP، RBF، GMDH) در کنار رویکرد پیشبینی یکگام بهجلو، از رویکرد چندگام بهجلو نیز استفاده شده است. با توجه به استفاده از دادههای ساعتی و اهمیت پیشبینی انرژی بادی در 24 ساعت آینده، رویکرد چندگام بهجلو بهصورت 24 گام در نظر گرفته شده است. همانگونه که در تکنیکهای سری زمانی همچون ARIMA بیان میشود، مقادیر گذشتۀ سری زمانی حاوی اطلاعات لازم برای پیشبینی روند آتی آن است. در این مطالعه نیز بهمنظور پیشبینی انرژی بادی از مقادیر گذشته این سری زمانی استفاده شده است. همچنین با توجه به تأثیر انکارناپذیر سرعت و جهت باد در تولید انرژی بادی و دسترسی به دادههای آنان، این دو متغیر همراه با وقفههای آن نیز در مدلسازی استفاده شدهاند. دادههای استفادهشده در این مطالعه از مزرعۀ بادی سوتاونتو[16] در ایالت گلسیای اسپانیا استخراج شدهاند.
بهمنظور ارزیابی قدرت پیشبینی تکنیکهای مختلف در این مطالعات مختلف از معیارهای گوناگونی استفاده میشود. با وجود این، دو معیار ریشه میانگین مربع (RMSE) و میانگین درصد مربع (MAPE) خطاهای پیشبینی از پرکاربردترین آنان محسوب میشوند [23] و [42]:
(25) |
|
(26) |
در روابط فوق و بهترتیب نشاندهندۀ انرژی بادی تولیدشده و پیشبینیشده در زمان iام هستند. با وجود این، در مسئلۀ موجود در این مطالعه معیار MAPE به سادگی استنادپذیر نخواهد بود؛ زیرا در برخی شرایط انرژی بادی تولیدی بسیار اندک و حتی ممکن است برابر با صفر باشد که در چنین شرایطی حتی اگر میزان پیشبینیشده به مقدار واقعی، بسیار نزدیک و صورت کسر رابطه (26) بسیار اندک باشد، کل کسر این رابطه مقدار بسیار بزرگ یا حتی بینهایت را نشان خواهد داد؛ ازاینرو، در این مطالعه از معیار میانگین درصد مربع اصلاحشده (MMAPE) برای غلبه بر کاستی فوق استفاده شده است [23]:
شکل (4): فرآیند پیشبینی انرژی بادی |
(27) |
همانگونه که گفته شد در این مطالعه بهمنظور پیشبینی انرژی بادی از دادههای سری انرژی بادی، سرعت و جهت همراه با 50 وقفه آنها استفاده شده است (رابطه زیر).
(28) |
همانگونه که مشاهده میشود متغیرهای توضیحی مدل، شامل 50 وقفه انرژی بادی (WP)، سرعت(S) و جهت باد (D) و همچنین سرعت و جهت باد در زمان t بهمنظور پیشبینی انرژی بادی در این زمان (t) است. با توجه به اینکه وقفههای متغیرهای توضیحی استفادهشده موجب افزایش بیش از حد اطلاعات ورودی شبکه میشود، لازم است از میان آنها تنها تعداد محدودی با اطلاعات مفید و مؤثر انتخاب شوند. بدین منظور مکانیزم پیشنهادی این مطالعه برای پیشبینی انرژی بادی شامل دو مرحله خواهد بود که در مرحلۀ نخست، به کمک معیار آنتروپی متقابل که در بخش دوم به تشریح آن پرداخته شد، متغیرهای مؤثر از میان 152 متغیر کاندید (150 متغیر شامل 50 وقفه سه متغیر انرژی بادی، سرعت و جهت باد و 2 متغیر سرعت و جهت باد در زمان پیشبینی t)، انتخاب و سپس در گام بعدی این متغیرهای در موتور پیشبینی استفاده شدهاند.
شکل (4) فرآیند پیشبینی انرژی بادی در این مطالعه را نشان میدهد. در گام نخست با استفاده از الگوریتم ترکیبی ژنتیک و انبوه ذرات بهبودیافته (EPSO-GA) متغیرهای مؤثر انتخاب میشوند که تابع هزینۀ آن آنتروپی متقابل بهصورت رابطه (14) است.
جدول (1): ویژگیهای شبکۀ عصبی RBF
فوریه |
می |
اوت |
نوامبر |
ماه |
5/4 |
9/3 |
9/3 |
3/3 |
Spread |
8 |
3 |
10 |
10 |
حداکثر نرون |
در این مرحله افزایش بیش از حد تعداد متغیرها، که موجب افزایش حشو میشود، بهبود چشمگیری در تابع هزینه نداشته و حتی ممکن است موجب افزایش آن شود؛ بنابراین تعداد متغیرها نیز میباید بهصورت هوشمند انتخاب شوند. بدین منظور لازم است الگوریتم ترکیبی دو دسته پاسخ محتمل ایجاد کند؛ یک دسته جهت انتخاب شماره متغیرهای کاندید (در اینجا ترکیبهای محتمل در بازه 1 تا 152) و یک دسته جهت انتخاب تعداد متغیرها که بدین منظور پس از ارائۀ پاسخ احتمالی ازسوی الگوریتم در بازه 0 تا 1 این عدد بهصورت عدد صحیح متناسب با فضای جستجو (1 تا 152) تبدیل میشود (رابطۀ زیر).
(29) |
در رابطۀ فوق با توجه به اینکه مقادیر محتمل پاسخ تولیدشدۀ x بین 0 تا 1 است، نتیجۀ رابطه یک عدد صحیح در بازۀ 1 تا N (برابر با تعداد متغیرهای کاندید) خواهد بود.
در گام دوم و پس از تعیین متغیرهای مؤثر به کمک آنها به آموزش شبکههای عصبی مختلف پرداخته میشود. رویکرد استفادهشده در این مرحله، استفاده از دادههای 80 روزۀ ساعتی است؛ به گونهای که این دادهها به سه دسته دادههای آموزشی، صحتسنجی و تست تقسیم میشوند که از دادههای 49 روز نخست برای آموزش و از دادههای روز
جدول (2): ارزیابی نتایج پیشبینی در افق 1 گام بهجلو
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
جدول (3): ارزیابی نتایج پیشبینی در افق 24 گام بهجلو
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
50ام برای صحتسنجی و از دادههای 30 روز پایانی برای تست مدل استفاده میشود.
همچنین پس از آزمون و خطا تعداد جمعیت الگوریتمها 50، میزان حداکثر تکرار500، معیار توقف بهبودنیافتن بعد از 50 تکرار و نرخ جهش[17] و همبری[18] بهترتیب 0.7 و 0.1 و نیز پارامترهای یادگیری (c1 و c2) برای pso هردو 1.4962 انتخاب شدند. کلیۀ برنامهها در فضای متلب و در یک سیستم با پردازنده corei5 و حافظه 4 گیگ اجرا شده است. با توجه به شکل (5)، علاوه بر زمان اجرای شبکه، که در جدول (2) و (3) به آن اشاره شده است، میباید زمان صرفشده در مرحلۀ انتخاب متغیرهای مؤثر نیز در نظر گرفته شود که این زمان برای ماههای مختلف بین 10 تا 13 ثانیه متغیر است. شایان توجه است باوجود افزودن این زمان، کل زمان صرفشده در تکنیک GMDH همچنان کمتر از تکنیکهای رقیب خواهد بود.
پس از آموزش و صحتسنجی شبکههای مختلف برای اطمینان از جامعیت آن براساس دو افق پیشبینی مختلف به پیشبینی مقادیر 30 روز پایانی پرداخته میشود؛ افق 1 ساعت و افق 24 ساعت که در افق یک ساعت (یک گام بهجلو) از دادههای واقعی یک ساعت گذشته استفاده میشود؛ ولی در افق 24 ساعت (چندگام بهجلو)، پس از ساعت اول برای ساعات بعدی تا 24 ساعت از مقادیر پیشبینیشده بهعنوان ورودی شبکه استفاده میشود.
همچنین در این مرحله بهمنظور بررسی بهتر نتایج، از ماههای فوریه، می، اوت و نوامبر بهترتیب بهعنوان نمایندۀ فصول مختلف سال و ماههای تست شبکه پس از آموزش آن استفاده شده است.
در روش ARIMA بهمنظور تعیین وقفه بهینه علاوه بر استفاده از متد باکسجنکینز از معیار آکائیک بیزین استفاده شد است [43] و [44]. در شبکه MLP پس از آزمون و خطا از تابع فعالسازی Logsig و خطی بهترتیب در نرونهای لایۀ پنهان و خروجی، استفاده و در شبکه RBF مقادیر حداکثر نرون و Spread برای ماههای مختلف بهصورت جدول (1) انتخاب شده است. نتایج پیشبینی در افق 1 و 24 گام بهجلو برای متدهای مختلف بهترتیب در جداول 2 و 3 ارائه شدهاند. در جدول 2 و 3 سطر آخر نشاندهندۀ مدت زمان آموزش و پیشبینی شبکه است که شبکۀ عصبی GMDH در هر دو افق پیشبینی کمترین زمان
شکل (5): متوسط (محور سمت راست) و انحراف معیار (محور سمت چپ) برازندگی اعضاء جمعیت و زمان بهینهیابی |
را داشته است. همچنین ارزیابی قدرت پیشبینی این شبکه براساس هردو معیار MMAPE و RMSE با سایر تکنیکها نیز نشاندهندۀ قدرت پیشبینی بیشتر آن است.
انرژی بادی، یکی از منابع انرژی تجدیدپذیر است که منبع جایگزین سوختهای فسیلی است و شایان توجه و تأکید است. با توجه به وابستگی شدید تولید انرژی بادی به تغییرات جوی و روند پرنوسان آن برای عرضۀ مطمئن آن در شبکههای توزیع، پیشبینی دقیق روند آتی آن اهمیت فراوانی دارد. با توجه به روند بهشدت نوسانی و غیرخطی توان تولیدی واحدهای بادی، در این مطالعه سیستم هوشمند ابتکاری برای پیشبینی مقادیر آیندۀ تولید توان واحدهای بادی ارائه شد. در این الگوریتم ابتدا به کمک نظریۀ اطلاعات، متغیرهای مؤثر همراه با وقفههای بهینه شناسایی شدند و سپس به کمک آن شبکۀ عصبی خودسازمانده موسوم به GMDH آموزش داده شد. شبکۀ عصبی GMDH به زمان اندکی برای آموزش نیاز داشت و ویژگی برجستۀ آن امکان تعیین ورودیهای مؤثر در پیشبینی از بین دادههای متعدد ورودی است. نتایج حاصل از شبیهسازی روی دادههای واقعی مزرعه بادی سوتاونتو در اسپانیا حاکی از دقت، سرعت و توانایی زیاد مدل پیشنهادی است.
[1] تاریخ ارسال مقاله: 04/05/1393
تاریخ پذیرش مقاله: 19/04/1397
نام نویسندۀ مسئول: وحید وحیدی نسب
نشانی نویسندۀ مسئول: ایران ـ تهران ـ دانشگاه شهید بهشتی ـ پردیس فنی و مهندسی شهید عباسپور ـ دانشکده مهندسی برق
[1] Sustainability
[2] Global Wind Energy Council (GWEC)
[3] External Criterion
[4] Cross correlation
[5] Redundancy
[6] Mutual Information (MI)
[7] Forward feature selection
[8] Quartile Discretization
[9] Conditional Entropy
[10] Complicated, Conflicting and Multitasking
[11] Insertion
[12] Swapping
[13] Reversion
[14] Relocating
[15] Voltrra
[16] Sotavento
[17] Mutation
[18] Cross Over