Wind Power Forecasting by a New Hybrid Forecast Engine Composed of GA/EPSO-Based Mutual Information and Group Method of Data Handling (GMDH)

Authors

1 Electric Energy Systems Planning and Operation Group, Department of Electrical Engineering, Abbaspour School of Engineering, Shahid Beheshti University, Tehran, Iran

2 Abbaspour School of Engineering, Shahid Beheshti University, Tehran, Iran

Abstract

a really tough and complicated issue. In this paper, a successful method is proposed for predicting the wind power productions which is based on the self-organized neural networks called Group Method of Data Handling (GMDH). By analyzing and discovering the hidden relationships between the inputs, the GMDH-based neural network intelligently presents the optimal model and predicts the output variable. Patterns used in this study are based on the two methods of artificial intelligence and information theory. At first, the effective variables are selected based on Mutual Information (MI) technique and the mixed particle swarm and genetic algorithm and after that the proposed forecast engine is used. In contrast to the mutual correlation method, in the proposed cross-entropy-based approach of this paper, non-linear relations between the variables are considered and the selection of effective variables in the forecasting of wind power in which nonlinear fluctuations and trends are observed are chosen more precisely and more accurately. In order to evaluate the ability, speed and accuracy of the proposed framework, real-world data of Sotavento wind farm in the Spain were used. The results of the study indicate that the proposed technique has a higher speed and accuracy than other methods.

Keywords

Main Subjects


1- مقدمه[1]

افزایش روزافزون نفوذ واحدهای بادی در سیستم‌های قدرت، تغییرات اساسی در تصمیمات برنامه‌ریزی و بهره‌برداری سیستم‌های قدرت را موجب می‌شود؛ بنابراین، اطلاع از میزان تولید واحدهای بادی، عامل بسیار مهمی در بهبود تصمیم‌گیری خواهد شد؛ اما از سوی دیگر، با توجه به نیاز فزاینده به منابع انرژی در اثر اجرای سیاست‌های توسعۀ اقتصادی و افزایش جمعیت جهانی و نیز کم‌یابی منابع سوخت‌های فسیلی و خطرات زیست محیطی ناشی از این سوخت‌ها، اهمیت توجه به سیاست‌گذاری و مدیریت انرژی را دوچندان می‌کند [1]. در این زمینه رویکردهای مختلفی همچون کاهش مصرف انرژی با اجرای سیاست‌های صرفه‌جویی انرژی و افزایش کارآیی انرژی و همچنین استفاده از منابع انرژی تجدیدپذیر وجود دارند [2]. فناوری‌های انرژی تجدیدپذیر باوجود مسائلی همچون تناوب در تولید انرژی و هزینۀ نگهداری زیاد، مزایای فراوانی دارند که رقابت‌پذیری آنها را در مقایسه با رقبای سنتی خود کمتر می‌کند. کاهش وابستگی به منابع سوخت فسیلی، کاهش آلودگی‌های زیست‌محیطی و گازهای گلخانه‌ای و نبود مسائل ایمنی مرتبط با انرژی اتمی [3] توجیه مناسبی است تا این منابع از دید اجتماعی از اقبال گسترده‌ای برخوردار باشند [4]. با وجود این، انتخاب نوع فناوری انرژی تجدیدپذیر نیز تصمیم مهمی است؛ به گونه‌ای که برخی پژوهشگران به بررسی و اولویت‌بندی انواع مختلف فناوری تولید انرژی تجدیدپذیر پرداخته‌اند. ایوانز و همکاران [5] در مطالعه‌ای براساس قابلیت پایداری[1] تکنولوژی‌های عمدۀ تولید انرژی تجدیدپذیر ارزیابی کرده‌اند. ایشان منابعی همچون انرژی بادی، برق‌آبی، فتووالتائی و زمین‌گرمایی را براساس بهای انرژی تولیدی، انتشار گازهای گلخانه‌ای، سهولت دسترسی، کارایی تبدیل انرژی، مساحت مورد نیاز، مصرف آب و اثرات اجتماعی ارزیابی و مقایسه کرده‌اند. نتایج مطالعه نشان دادند انرژی بادی باوجود نیاز به مساحت و سرمایۀ زیاد، کمترین میزان آلودگی و مصرف آب و اثرات اجتماعی مطلوبی دارد. بر اساس این، انرژی بادی سهم عمده‌ای در میان انرژی‌های تجدیدپذیر داشته و اخیراً نفوذ چشمگیری در بازار برق کشورهای مختلف داشته است؛ به گونه‌ای که گزارش شورای جهانی انرژی بادی[2] ظرفیت انرژی بادی از 4/17 گیگاوات در سال 2000 به 587/282 گیگاوات در سال 2012 رسیده است. با وجود این، به دلیل وابستگی انرژی بادی به شرایط متغیر و ناپایدار جوی، میزان عرضۀ آن پرنوسان است؛ به‌ویژه آنکه سرعت باد در تولید انرژی بادی نقش عمده‌ای دارد و ممکن است در طی زمان نوسانات شدیدی داشته باشد؛ ازاین‌رو، عرضه‌کنندگان و فعالان حیطۀ انرژی بادی به پیش‌بینی‌های دقیق در این زمینه بسیار علاقه‌مند بوده‌اند و سعی می‌کنند به کمک ابزار پیش‌بینی مناسب با سایر نیروگاه‌های شبکه هماهنگ شوند و از هزینه‌های تولید مازاد خودداری کنند؛ ازاین‌رو، اهمیت پیش‌بینی دقیق انرژی بادی در مزارع بادی روزبه‌روز در حال افزایش است [6]. در این بین، پیش‌بینی کوتاه‌مدت انرژی بادی برای کاهش هزینۀ مقادیر رزروشده (به منظور قابلیت اطمینان سیستم) و افزایش درآمد ژنراتورهای بادی (با ارائۀ پیشنهادات بهینه در بازار برق) اهمیت فراوانی دارند.

مطالعات مختلف نتایج مطلوبی از پیش‌بینی انرژی بادی با استفاده از تکنیک‌های سری‌زمانی ارائه می‌کنند. تکنیک‌های خانواده ARIMA یکی از رویکردهای پرکاربرد در این میان است [7] و [8]. این دسته شامل تکنیک‌هایی همچون AR، MA، ARMA، ARIMA و SARIMA است. باوجود توانایی این رویکرد در ارائۀ فرم تبعی میان ورودی و خروجی، محدودبودن به معادلات خطی از معایب این رویکرد به شمار می‌رود. در مقابل رویکردهای هوش مصنوعی (AI) و یادگیری ماشینی (ML) به دلیل توانایی بیشتر در مدلسازی روابط غیرخطی توجه پژوهشگران در زمینۀ پیش‌بینی انرژی بادی را جلب کرده‌اند. این تکنیک‌ها شامل انواع مختلف شبکه‌های عصبی ازجمله BP و RBF [9] و [10]، SVM [11] و منطق فازی [12] هستند. در زمینۀ کاربرد تکنیک‌های مختلف در پیش‌بینی انرژی بادی [13] و [14] و [15] و [16] بررسی اجمالی مفیدی ارائه کرده‌اند. مروری بر نتایج مطالعات مختلف در این زمینه نشان می‌دهند به دلیل روند غیرخطی و پرنوسان انرژی بادی تکنیک‌های غیرخطی به‌خصوص شبکه‌های عصبی نتایج مطلوبی داشته‌اند.

با وجود این، شبکه‌های عصبی استفاده‌شده در مطالعات مختلف کاستی‌هایی نیز دارند. در رویکرد سنتی پیش از اقدام به آموزش شبکه لازم است ساختار آن از قبل تعیین شده باشد. از سوی دیگر، نتایج بسیار متفاوتی با تغییر در ساختار پارامترهای شبکه ازجمله مقادیر وزن‌های اولیه، تعداد لایه‌های پنهان و تعداد نرون‌ها در لایۀ پنهان در مرحلۀ آموزش شبکه حاصل می‌شوند. همچنین چرخه‌های تکراری زیادی با ساختارهای مختلف لازم است تا ساختار دقیق شبکه مشخص شود؛ ازاین‌رو، شبکۀ عصبی GMDH برای غلبه بر کاستی‌های فوق ارائه شده است.

شبکۀ عصبی GMDH براساس فرآیند خودسازماندهی و ارزیابی داده‌ها به‌صورت جداگانه با استفاده از معیار خارجی[3] برای مدلسازی‌های پیچیده کاربرد دارد. در این الگوریتم، متغیرهایی تأثیرگذار بر فرآیند به‌عنوان ورودی شبکه استفاده می‌شوند. این الگوریتم با بررسی و کشف روابط بین آنها و آزمون مدل‌های پیشنهادی به‌طور هوشمند، مدل بهینه‌ای را ارائه و متغیر خروجی را پیش‌بینی می‌کند. بر اساس این، الگوسازی‌های به‌کاررفته در این مطالعه مبتنی بر دو روش هوش مصنوعی و نظریۀ اطلاعات است؛ به گونه‌ای که در الگوریتم پیشنهادی ابتدا متغیرهای مؤثر براساس اطلاعات متقابل (MI) و به کمک الگوریتم ترکیبی انبوه‌ذرات و ژنتیک (PSO-GA)، انتخاب و سپس در موتور پیش‌بینی به کار گرفته می‌شوند. برخلاف روش ارتباط متقابل[4] در رویکرد استفاده‌شده، (Cross entropy) روابط غیرخطی میان متغیرها در نظر گرفته می‌شود و انتخاب متغیرهای مؤثر در پیش‌بینی انرژی بادی که در آن نوسانات و روند غیرخطی مشاهده می‌شود، با دقت و اعتبار بیشتری انتخاب می‌شود.

در ادامه ابتدا به تشریح روش انتخاب متغیرهای مؤثر و تکنیک شبکۀ عصبی GMDH پرداخته و سپس الگوریتم پیشنهادی به‌منظور پیش‌بینی انرژی بادی ارائه می‌شود.

 

2- انتخاب متغیرها با روش آنتروپی متقابل

در این بخش مختصری از نظریۀ اطلاعات و مفاهیم مربوط به آن، ارائه و درنهایت به‌منظور انتخاب متغیرهای مؤثر تابعی مبتنی بر آن ارائه می‌شود. نظریۀ اطلاعات به نظریۀ ریاضی ارتباطات معروف است و با ویژگی‌هایی چون قلمرو فوق‌العاده کلی، برخورد اصولی و پایه‌ای با مسائل و مشکلات و سادگی و استحکام نتایج به‌بارآورنده توصیف شده است [17].

نظریۀ ریاضی ارتباطات، به‌منزلۀ پایۀ نظریۀ اطلاعات ازسوی کلودشانون در سال 1948 ارائه شد. این نظریه راه‌حلی بود برای مسئلۀ فرستادن حداکثر مقدار اطلاعات از مجرای معین و اندازه‌گیری ظرفیت مجرا برای حمل اطلاعات.

در نظریۀ اطلاعات حشو[5] و آنتروپی دو مفهوم رایج به‌شمار می‌روند. حشو، متضاد آنتروپی است که به پیش‌بینی‌پذیری یا قراردادی‌بودن پیام دلالت دارد. درواقع، حشو نتیجۀ پیش‌بینی‌پذیری زیاد است؛ در حالی که آنتروپی نشانۀ پیش‌بینی‌پذیری اندک است؛ بنابراین پیامی با پیش‌بینی‌پذیری اندک دارای آنتروپی و «اطلاعات» بسیار است. برعکس، پیامی با پیش‌بینی‌پذیری زیاد، حشو بسیار و «اطلاعات» اندک دارد؛ بنابراین آنتروپی، به تصادفی‌بودن یا نبود سازمان (نظم) در یک موقعیت گفته می‌شود. هرچه میزان پیش‌بینی در پیام کمتر شود، میزان آنتروپی آن افزایش می‌یابد.

بر اساس این، در زمینۀ پیش‌بینی سری‌های زمانی نیز به کمک نظریۀ اطلاعات از میان انبوهی از متغیرهای متنوع تنها تعداد محدود و مؤثری از آنها به‌عنوان متغیر توضیحی استفاده می‌شوند. در این زمینه برخی مطالعات به کمک معیار اطلاعات متقابل (MI[6]) به انتخاب ویژگی پرداخته‌اند. سایمون و ورلیسن (2007) به‌منظور انتخاب وقفه بهینۀ سری زمانی، استفاده از ابزار اطلاعات متقابل را پیشنهاد می‌کنند [18]. همچنین فرانسوا و همکاران (2007) در مطالعه‌ای با ترکیب معیار اطلاعات متقابل و استراتژی انتخاب ویژگی روبه‌جلو[7] سعی در ارائۀ راه‌حلی بهینه میان مجموعه ویژگی‌های (متغیرهای) انتخاب‌شده و زمان محاسبه داشتند [19]. مِی و همکاران (2008) در مطالعه‌ای به‌منظور پیش‌بینی کیفیت آب میان سیستم‌های توزیع آب از معیار اطلاعات متقابل در انتخاب متغیرهای ورودی شبکۀ عصبی بهره بردند [20]. امجدی و دارایی‌پور (2009) در مطالعۀ خود به‌منظور پیش‌بینی قیمت‌های آتی در بازار برق با استفاده از شبکۀ عصبی آبشار از معیار اطلاعات متقابل برای انتخاب متغیرهای ورودی شبکه استفاده کردند [21]. امجدی و کی‌نیا (2011) در مطالعه‌ای دیگر به‌منظور پیش‌بینی قیمت برق با استفاده از شبکه‌های عصبی احتمالی و ترکیبی از معیار اطلاعات متقابل در انتخاب مجموعه متغیرهای مؤثر ورودی شبکه استفاده کردند [22]. امجدی و همکاران (2011) در مطالعه‌ای در زمینۀ پیش‌بینی انرژی بادی به کمک شبکۀ عصبی ریجلت از معیار اطلاعات متقابل به‌منظور انتخاب متغیرهای ورودی شبکه بهره بردند [23]. کی‌نیا (2012) در مطالعه‌ای به کمک شبکۀ عصبی مرکب و معیار اطلاعات متقابل به پیش‌بینی قیمت برق پرداخت. کاظم و همکاران (2013) به‌منظور پیش‌بینی شاخص سهام نزدک، بانک جهانی و مایکروسافت با استفاده از شبکه‌های عصبی مختلف به انتخاب متغیرهای ورودی شبکه به کمک اطلاعات متقابل پرداختند [24].

در این مطالعه نیز براساس نظریۀ اطلاعات و به کمک تابع آنتروپی متقابل (CEF) متغیرهای مؤثر، ورودی شبکه‌های عصبی انتخاب می‌شود. این تکنیک نه‌تنها در انتخاب انوع متغیرهای مؤثر (سرعت و جهت باد)، در انتخاب وقفه‌های متغیر هدف و متغیرهای ورودی راه‌گشا خواهد بود. تحلیل‌های مبتنی بر رویکرد پیشنهادی نه‌تنها همانند تابع همبستگی متقابل (CCF) روابط خطی را در انتخاب متغیرهای مؤثر لحاظ می‌کند، روابط غیرخطی میان آنها را نیز لحاظ می‌کند.

اطلاعات متقابل دو متغیر پیوستۀ تصادفی x و y با MI(y,x) نشان داده می‌شوند که مبتنی بر تابع چگالی احتمال مشترک آنها P(y,x) و همچنین تابع چگالی احتمال تک‌تک آنها P(x) وP(y) است [25]:

(1)

 

رابطۀ فوق چنانچه متغیرهای مورد بحث گسسته باشند، به‌صورت زیر خواهد بود [26]:

(2)

 

بنابراین متغیرهای در مرحلۀ انتخاب ویژگی براساس رویکرد گسسته‌سازی چهارکی[8] به متغیر گسسته تبدیل می‌شوند. تبدیل و گسسته‌سازی متغیرهای حقیقی به نوعی از داده‌ها با مقادیر محدود، بیشتر در الگوریتم‌های یادگیری ماشینی ضروری است [27].

آنتروپی شرطی[9] متغیر تصادفی گسسته Y با فرض رخداد به‌صورت زیر خواهد بود [26]:

(3)

 

که در آناحتمال با فرض رخداد است. آنتروپی شرطی Y در صورت معین بودن X نیز به‌صورت زیر خواهد بود [26]:

(4)

 

که نشان‌دهندۀ عدم‌قطعیت دربارۀ Y در صورت مشخص‌بودن تمام رخدادهای X است و فرم مناسب برای آن به‌صورت زیر خواهد بود [26]:

(5)

 

در رابطۀ فوق H(X,Y) به‌صورت زیر محاسبه می‌شود که نشان‌دهندۀ آنتروپی مشترک X و Y است [26]:

(6)

 

به‌طورکلی آنتروپی شرطی Y در قبال متغیرهای توضیحی به‌صورت زیر خواهد بود [26]:

(7)

 

 

در صورتی که ارزش عددی رابطۀ فوق برابر با صفر باشد، به این معنی خوهد بود که متغیرهای توضیحی کاملاً به توضیح تغییرات متغیر هدف (Y) قادرند [28].

همان‌طور که گفته شد در این مطالعه به‌منظور یافتن همبستگی (خطی و غیرخطی) میان متغیرهای ورودی و متغیر هدف از تابع آنتروپی متقابل استفاده شده است. هدف این تکنیک انتخاب وقفه‌های بهینۀ مدل پویا در کنار انتخاب هر متغیر مؤثر است. بر اساس این، ابتدا لازم است مختصری دربارۀ تابع همبستگی متقابل توضیح داده شود.

تابع همبستگی متقابل براساس ضریب همبستگی پیرسون r بنا شده است که این ضریب درجۀ همبستگی میان دو متغیر تصادفی را مبتنی بر انطباق خطی داده‌ها نشان می‌دهد. این ضریب مقداری بین 1- تا 1+ می‌پذیرد؛ به‌گونه‌ای که مقدار 1+ نشان‌دهندۀ همبستگی مثبت کامل خطی و مقدار 1- همبستگی منفی کامل خطی را نشان می‌دهد و مقدار 0 برای این ضریب نشان می‌دهد دو متغیر بررسی‌شده هیچ ارتباط خطی باهم ندارند. با وجود این، در چنین شرایطی احتمال وجود روابط غیرخطی وجود خواهد داشت.

رابطۀ زیر نحوۀ محاسبۀ این ضریب میان دو متغیر با N مشاهده را نشان می‌دهد [29]:

(8)

 

در رابطۀ فوق و مقادیر اندازگیری‌شدۀ متغیرهای تصادفی x و y بوده‌اند و و نیز میانگین آنها هستند. بر اساس این، برای هر متغیر و وقفۀ آن ضریب پیرسون محاسبه شده است و برای یافتن مؤثرترین آنها، متغیرهایی با بیشترین ضریب پیرسون انتخاب خواهد شد. با وجود این، همان‌گونه که گفته شد این ضریب تنها براساس روابط خطی محاسبه شده‌اند و بنابراین در مواجه با سیستم‌های غیرخطی کاستی‌هایی دارند. برای غلبه بر این کاستی‌ها در این مطالعه تکنیک مناسبی برای تحلیل سیستم‌های غیرخطی ارائه شده است. رابطۀ زیر نشان‌دهندۀ اطلاعات متقابل نرمال‌شده میان دو سری زمانی X و Y است [26]:

(9)

 

در رابطۀ فوق پارامتر R مقداری بین 0 و 1 می‌پذیرد و نشان‌دهندۀ میزان اطلاعاتی دربارۀ متغیر هدف است که با متغیر ورودی توضیح داده می‌شود. بر اساس این، چنانچه متغیر X کلیۀ اطلاعات ضروری برای پیش‌بینی Y را دارا باشد، در این صورت برابر با صفر می‌شود و درنتیجه R برابر 1 خواهد بود. از سوی دیگر، چنانچه متغیر X هیچ اطلاعاتی از متغیر Y را در بر نداشته باشد،برابر با  می‌شود و درنتیجه R برابر با 0 خواهد بود [30].

تابع اطلاعات متقابل ارائه‌شده در رابطه (9) برای هر متغیر و وقفه‌های آن محاسبه می‌شود و به دنبال آن، متغیرهایی که دارای مقدار بیشتری برای این تابع باشند، متغیر مؤثر انتخاب خواهند شد. این رویکرد برای انتخاب هر متغیر و وقفه بهینۀ آن به‌طور مستقل و بدون توجه به وابستگی میان آنها نتایج مطلوبی خواهد داشت.

در این رویکرد چنانچه وقفۀ انتخابی مثبت باشد، نشان‌دهندۀ پویایی سیستم و ارتباط مقادیر فعلی متغیر هدف با مقادیر گذشته متغیر توضیحی است. چانچه متغیر بدون وقفه انتخاب شود، نشان‌دهندۀ سیستم ایستا است و در صورتی که وقفۀ پیشنهادی منفی باشد، نشان‌دهندۀ رابطۀ علیت معکوس خواهد بود. بدین صورت که مقادیر فعلی متغیر هدف بر مقادیر آتی متغیر ورودی اثرگذار است.

همان‌گونه که مشاهده می‌شود در رابطه (9) همبستگی میان متغیرهای ورودی در نظر گرفته نشده است؛ بنابراین براساس اصول حداکثر ارتباط و حداقل حشو مسئلۀ بهینه‌یابی چندهدفۀ زیر برای جلوگیری از حشو در انتخاب مؤثرترین ورودی‌های سیستم استفاده می‌شود [30]:

(10)

 

(11)

 

در روابط فوق V و P به‌صورت زیر محاسبه می‌شوند:

(12)

 

(13)

 

در روابط فوق نیز نشان‌دهندۀ اطلاعات مشترک میان دو متغیر تصادفی a و b است. اجرای اصل حداکثر ارتباط، مبتنی بر انتخاب متغیرها و وقفه‌هایی از آنهاست که رابطه (10) را حداکثر کنند؛ به این صورت که در که در آن ورودی i ام و Y خروجی سیستم است، باید میانگین اطلاعات متقابل کلیۀ ورودی‌ها افزایش یابد. اجرای اصل حداقل حشو نیز مبتنی بر انتخاب متغیرها و وقفه‌هایی از آنهاست که رابطه (11) را حداقل کنند؛ به این صورت که در که در آن و  متغیرهای ورودی‌اند، باید میانگین اطلاعات متقابل کلیۀ ورودی‌ها کاهش یابد.

به‌منظور یافتن پاسخ بهینۀ مسئلۀ فوق در الگوریتم بهینه‌یابی با فرض می‌توان آن را به‌صورت مسئله حداقل‌سازی زیر در نظر گرفت [26]:

(14)

 

حداقل‌سازی رویکرد مناسب برای حداکثرسازی رابطه (10) و حداقل‌سازی رابطه (11) است.

باید توجه داشت انتخاب متغیرهای مؤثر از میان n متغیر با وقفه‌های t=0,1,…,k بسیار زمان‌بر است. در چنین شرایطی متغیر کاندید وجود خواهد داشت که با در نظر گرفتن جایگشت‌های مختلف آنها فضای جستجو برابر با خواهد بود؛ ازاین‌رو در چنین مسئله‌ای استفاده از الگوریتم‌های تکاملی برای جستجوی فضای بسیار گسترده مسئلۀ ضروری است.

 

3- الگوریتم ترکیبی انبوه ذرات و ژنتیک

همان‌گونه که در بخش قبل بیان شد جستجوی متغیرهای مؤثر در فضای بسیار گسترده، ابزار بهینه‌یابی مناسبی را می‌طلبد؛ بنابراین در این بخش به معرفی الگوریتم ترکیبی انبوه ذرات و ژنتیک بهبودیافته پرداخته می‌شود. الگوریتم ژنتیک و الگوریتم انبوه ذرات هردو از الگوریتم‌های جمعیت محورند که قدرت آنها در حل مسائل بهینه‌یابی بسیار دشوار به اثبات رسیده است [31]. با وجود این، دو مدل برجستگی‌ها و کاستی‌های خاص خود را دارند. الگوریتم انبوه ذرات ازنظر مفهومی بسیار ساده و ازنظر پیاده‌سازی تنها در چند خط، کد می‌شوند. الگوریتم انبوه ذرات همچنین برخلاف الگوریتم ژنتیک دارای حافظه‌اند؛ در حالی که در الگوریتم ژنتیک چنانچه ذره‌ای برای نسل بعد انتخاب نشود، خاطرات آن کلاً محو خواهد شد. در الگوریتم انبوه ذرات فعل و انفعالات مشترک و همکاری گروه، بهبود جستجو برای یافتن پاسخ بهینه را موجب می‌شود؛ در حالی که الگوریتم ژنتیک در یافتن پاسخ دقیق با مشکل مواجه است، در یافتن بهینۀ سراسری عملکرد مناسبی دارد [32].

با وجود این، بدون عملگر انتخاب الگوریتم انبوه ذرات ممکن است منابع محاسباتی را روی ذراتی به هدر دهد که ازنظر پاسخ مسئلۀ ضعیف ارزیابی می‌شوند و در ناحیۀ نامناسبی قرار دارند. مقایسه میان هردو الگوریتم ژنتیک و انبوه ذرات با [33] و [34] انجام شده است و درنهایت هردو مطالعه پیشنهاد کرده‌اند ترکیبی از الگوریتم ژنتیک و انبوه ذرات استاندارد به استراتژی جستجوی کارآمدتری منجر خواهد شد. الگوریتم انبوه ذرات استاندارد ممکن است انعطاف کافی برای مسائل کاربردی را نداشته باشد؛ به‌خصوص زمانی که این مسائل پیچیده، ناسازگار و چندهدفه[10] باشند.

روش‌های مختلفی برای ترکیب این دو الگوریتم وجود دارند. یک رویکرد استفاده از تنها یک الگوریتم در مرحلۀ انتخاب و سپس استفاده از عملگرهای الگوریتم دیگر برای ایجاد پاسخ‌های بهینه است. مطالعه [35] و [36] چنین رویکردی داشته است. رویکرد دیگر در ترکیب این دو الگوریتم تقسیم جمعیت به دو دسته است که در آن برای هر دسته تنها عملگرهای یک الگوریتم اعمال می‌شود. مطالعه [37] و [38] چنین رویکردی داشته‌اند.

 

 

6

7

5

9

4

8

2

3

1

Insertion

6

7

9

4

8

2

5

3

1

 

 

 

 

 

6

2

9

4

8

7

5

3

1

Swapping

6

7

9

4

8

2

5

3

1

 

 

 

 

 

6

7

2

8

4

9

5

3

1

Reversion

6

7

9

4

8

2

5

3

1

 

                                             

شکل (1): نتایج اعمال عملگرهای جابه‌جایی بر جواب فرضی

 

 

در این مطالعه رویکرد نوینی در ترکیب این دو الگوریتم ارائه شده است؛ به گونه‌ای ضمن اعمال همزمان کلیۀ عملگرهای هردو الگوریتم روی جمعیت، از عملگرهای متناسب با مسئلۀ این مطالعه برای بهبود نتایج نیز استفاده شده است. در این رویکرد عملگرهای درج[11]، تعویض[12] و وارون[13]کردن استفاده شده‌اند که کلیۀ این عملگرها را عملگرهای جابه‌جایی[14] می‌نامیم.

شکل (1) نتیجۀ اعمال این عملگرها به پاسخ فرضی را نشان می‌دهد.

 

همچنین شکل (2) مراحل اجرای الگوریتم ترکیبی ارائه‌شده در این مطالعه را نشان می‌دهد. با توجه به شکل (2)، در این تکنیک پس از ایجاد جمعیت اولیه به‌ترتیب عملگرهای الگوریتم انبوه ذرات و الگوریتم ژنتیک بر کلیۀ افراد اعمال می‌شوند که فرایند مربوط به هریک پیش‌تر بحث شد. شرط توقف در این الگوریتم، معیار حداکثر تعداد تکرار و بهبودنیافتن تابع هدف است.

 

4- شبکۀ عصبی GMDH

امروزه دیدگاه دیگری به موازات مدل‌های سری زمانی در زمینۀ پیش‌بینی مطرح است. برتری مهم این روش‌ها که به شبکه‌های عصبی مصنوعی (ANN) معروف‌اند، نیازنداشتن به اعمال فرضیه‌های خاص دربارۀ رفتار متغیرها است. شبکه‌های عصبی مصنوعی از عناصر عملیاتی ساده‌ای ساخته شده‌اند که سازوکار آنها از سیستم‌های عصبی بیولوژیکی الهام گرفته شده است.

 

 

شکل (2): فلوچارت ترکیب الگوریتم انبوه ذرات و ژنتیک

شبکه‌های عصبی مصنوعی از تعدادی واحد پردازش متصل به هم تشکیل شده‌اند که نرون نامیده می‌شوند.

ساختار شبکۀ عصبی مصنوعی به گونه‌ای است که نرون‌ها در دسته‌هایی که لایه نام دارند، مرتب می‌شوند. یکی از قابلیت‌های شبکۀ عصبی این است که می‌توان با داشتن ورودی، شبکه را طوری آموزش داد (یعنی وزن‌های نرون‌ها را طوری اختیار کرد) تا خروجی مطلوب به دست آید.

نخستین بار دانشمند اوکراینی به‌نام ایواخننکو در سال 1965 شبکۀ عصبی GMDH را معرفی کرد [39]. شبکۀ عصبی GMDH شبکه‌ای خودسازمانده و یک‌سویه است که از چندین لایه حاصل شده و هر لایه از چندین نرون تشکیل شده است. تمامی نرون‌ها از ساختار مشابهی برخوردارند؛ طوری که دارای دو ورودی و یک خروجی‌اند و هر نرون با 5 وزن و یک بایاس عمل پردازش را میان داده‌های ورودی و خروجی براساس رابطه (15) برقرار می‌کند [39].

(15)

 

در رابطه فوق، که در آن (N) تعداد مشاهدات بوده و  وکه در آنها (m) تعداد نرون‌های لایۀ قبلی است، وزن‌ها براساس روش حداقل مربعات معمولی (OLS)، محاسبه و سپس به‌عنوان مقادیر مشخص و ثابت در داخل هر نرون جایگذاری می‌شوند. ویژگی بارز این نوع شبکه آن است که نرون‌های مرحلۀ قبل و یا لایۀ قبلی عامل مولد تولید نرون‌های جدید به تعداد  هستند و از میان نرون‌های تولیدشده، لزوماً تعدادی حذف می‌شوند تا بدین‌وسیله از واگرایی شبکه جلوگیری شود. همچنین نرون‌هایی که برای ادامه و گسترش شبکه باقی می‌مانند نیز ممکن است به دلیل ارتباط‌نداشتن مستقیم یا غیرمستقیم با لایۀ آخر و ایجاد فرم همگرایی شبکه حذف شوند که اصطلاحاً به آنها نرون‌های غیرفعال می‌گویند. معیار حذف و گزینش مجموعه‌ای از نرون‌ها در یک لایه، میانگین مجموع مربع خطاها (MSE) میان خروجی واقعی و خروجی هر نرون است. این معیار برای خروجی نرونjام یعنی () به‌صورت رابطه (16) خواهد بود [39]:

(16)

 

در رابطۀ فوق است که در آن m تعداد نرون‌های گزینش‌شده در لایۀ قبلی است. نگاشتی بین متغیرهای ورودی و خروجی که این نوع از شبکه‌های عصبی برقرار می‌کنند، به‌صورت تابع غیرخطی ولترا[15] به‌صورت رابطه (17) است [40]:

(17)

 

ساختاری که برای نرون‌ها در نظر گرفته شده است، به‌صورت فرم خلاصه‌شدۀ دو متغیره درجۀ دوم زیر خواهد بود:

(18)

 

ضرایب مجهول در معادله (18) با تکنیک رگرسیونی چنان به دست می‌آیند که اختلاف بین خروجی واقعی y و مقادیر محاسبه‌شدۀ، برای هر جفت متغیر ورودیو کمینه شود. مجموعه‌ای از چند جمله‌ای‌ها، با استفاده از معادلۀ (18) است که ضرایب مجهول همۀ آنها، با استفاده از روش حداقل مربعات معمولی (OLS) به دست می‌آید. برای هر تابع Gi(هر نرون ساخته‌شده)، ضرایب معادلات هر نرون برای حداقل‌کردن خطای آن، به‌منظور انطباق بهینۀ ورودی‌ها بر تمام جفت مجموعه‌های ورودی – خروجی به دست می‌آیند.

(19)

 

در روش پایه‌ای الگوریتم GMDH، تمام ترکیبات دوتایی (نرون‌ها) از n متغیر ورودی ساخته شده‌اند و ضرایب مجهول تمامی نرون‌ها با استفاده از روش حداقل مربعات به دست می‌آیند؛ بنابرایننرون در لایۀ دوم ساخته می‌شوند که می‌توان آنها را به شکل مجموعۀ زیر نمایش داد.

(19)

 

از شکل درجۀ دوم تابع بیان‌شده در معادله (18)، برای هر M ردیف سه‌تایی استفاده می‌شود. این معادلات را می‌توان به شکل ماتریسی (20) بیان کرد:

(20)

 

که در آن A، بردار ضرایب مجهول معادله درجه دو نشان داده شده در معادله (18) است؛ یعنی:

(21)

 

و

(22)

 

از مقادیر بردارهای ورودی و شکل تابع به‌راحتی مشاهده می‌شود که:

(23)

 

روش حداقل مربعات از آنالیز رگرسیون چندگانه، حل معادلات را به شکل معادله (24) به دست می‌دهد [41]:

(24)

 

این معادله بردار ضرایب معادله‌ (18) را برای تمام M مجموعۀ سه‌تایی ایجاد می‌کند.

شکل (3) ساختار نمونه از شبکۀ عصبی GMDH را نشان می‌دهد.

 

 

 

 

شکل (3): ساختار شبکۀ عصبی GMDH

 

5- پیش‌بینی توان تولیدی واحد بادی

در این مطالعه به‌منظور مقایسۀ کارایی عملیاتی روش‌های مختلف (ARIMA، MLP، RBF، GMDH) در کنار رویکرد پیش‌بینی یک‌گام به‌جلو، از رویکرد چندگام به‌جلو نیز استفاده شده است. با توجه به استفاده از داده‌های ساعتی و اهمیت پیش‌بینی انرژی بادی در 24 ساعت آینده، رویکرد چندگام به‌جلو به‌صورت 24 گام در نظر گرفته شده است. همانگونه که در تکنیک‌های سری زمانی همچون ARIMA بیان می‌شود، مقادیر گذشتۀ سری زمانی حاوی اطلاعات لازم برای پیش‌بینی روند آتی آن است. در این مطالعه نیز به‌منظور پیش‌بینی انرژی بادی از مقادیر گذشته این سری زمانی استفاده شده است. همچنین با توجه به تأثیر انکارناپذیر سرعت و جهت باد در تولید انرژی بادی و دسترسی به داده‌های آنان، این دو متغیر همراه با وقفه‌های آن نیز در مدلسازی استفاده شده‌اند. داده‌های استفاده‌شده در این مطالعه از مزرعۀ بادی سوتاونتو[16] در ایالت گلسیای اسپانیا استخراج شده‌‌اند.

به‌منظور ارزیابی قدرت پیش‌بینی تکنیک‌های مختلف در این مطالعات مختلف از معیارهای گوناگونی استفاده می‌شود. با وجود این، دو معیار ریشه میانگین مربع (RMSE) و میانگین درصد مربع (MAPE) خطاهای پیش‌بینی از پرکاربردترین آنان محسوب می‌شوند [23] و [42]:

(25)

 

(26)

 

در روابط فوق  و به‌ترتیب نشان‌دهندۀ انرژی بادی تولیدشده و پیش‌بینی‌شده در زمان iام هستند. با وجود این، در مسئلۀ موجود در این مطالعه معیار MAPE به سادگی استنادپذیر نخواهد بود؛ زیرا در برخی شرایط انرژی بادی تولیدی بسیار اندک و حتی ممکن است برابر با صفر باشد که در چنین شرایطی حتی اگر میزان پیش‌بینی‌شده به مقدار واقعی، بسیار نزدیک و صورت کسر رابطه (26) بسیار اندک باشد، کل کسر این رابطه مقدار بسیار بزرگ یا حتی بی‌نهایت را نشان خواهد داد؛ ازاین‌رو، در این مطالعه از معیار میانگین درصد مربع اصلاح‌شده (MMAPE) برای غلبه بر کاستی فوق استفاده شده است [23]:

 

 

شکل (4): فرآیند پیش‌بینی انرژی بادی

 

 

(27)

 

همان‌گونه که گفته شد در این مطالعه به‌منظور پیش‌بینی انرژی بادی از داده‌های سری انرژی بادی، سرعت و جهت همراه با 50 وقفه آنها استفاده شده است (رابطه زیر).

(28)

 

همان‌گونه که مشاهده می‌شود متغیرهای توضیحی مدل، شامل 50 وقفه انرژی بادی (WP)، سرعت(S) و جهت باد (D) و همچنین سرعت و جهت باد در زمان t به‌منظور پیش‌بینی انرژی بادی در این زمان (t) است. با توجه به اینکه وقفه‌های متغیرهای توضیحی استفاده‌شده موجب افزایش بیش از حد اطلاعات ورودی شبکه می‌شود، لازم است از میان آنها تنها تعداد محدودی با اطلاعات مفید و مؤثر انتخاب شوند. بدین منظور مکانیزم پیشنهادی این مطالعه برای پیش‌بینی انرژی بادی شامل دو مرحله خواهد بود که در مرحلۀ نخست، به کمک معیار آنتروپی متقابل که در بخش دوم به تشریح آن پرداخته شد، متغیرهای مؤثر از میان 152 متغیر کاندید (150 متغیر شامل 50 وقفه سه متغیر انرژی بادی، سرعت و جهت باد و 2 متغیر سرعت و جهت باد در زمان پیش‌بینی t)، انتخاب و سپس در گام بعدی این متغیرهای در موتور پیش‌بینی استفاده شده‌اند.

شکل (4) فرآیند پیش‌بینی انرژی بادی در این مطالعه را نشان می‌دهد. در گام نخست با استفاده از الگوریتم ترکیبی ژنتیک و انبوه ذرات بهبودیافته (EPSO-GA) متغیرهای مؤثر انتخاب می‌شوند که تابع هزینۀ آن آنتروپی متقابل به‌صورت رابطه (14) است.

جدول (1): ویژگی‌های شبکۀ عصبی RBF

فوریه

می

اوت

نوامبر

ماه

5/4

9/3

9/3

3/3

Spread

8

3

10

10

حداکثر نرون

 

در این مرحله افزایش بیش از حد تعداد متغیرها، که موجب افزایش حشو می‌شود، بهبود چشمگیری در تابع هزینه نداشته و حتی ممکن است موجب افزایش آن شود؛ بنابراین تعداد متغیرها نیز می‌باید به‌صورت هوشمند انتخاب شوند. بدین منظور لازم است الگوریتم ترکیبی دو دسته پاسخ محتمل ایجاد کند؛ یک دسته جهت انتخاب شماره متغیرهای کاندید (در اینجا ترکیب‌های محتمل در بازه 1 تا 152) و یک دسته جهت انتخاب تعداد متغیرها که بدین منظور پس از ارائۀ پاسخ احتمالی ازسوی الگوریتم در بازه 0 تا 1 این عدد به‌صورت عدد صحیح متناسب با فضای جستجو (1 تا 152) تبدیل می‌شود (رابطۀ زیر).

(29)

 

در رابطۀ فوق با توجه به اینکه مقادیر محتمل پاسخ تولیدشدۀ x بین 0 تا 1 است، نتیجۀ رابطه یک عدد صحیح در بازۀ 1 تا N (برابر با تعداد متغیرهای کاندید) خواهد بود.

در گام دوم و پس از تعیین متغیرهای مؤثر به کمک آنها به آموزش شبکه‌های عصبی مختلف پرداخته می‌شود. رویکرد استفاده‌شده در این مرحله، استفاده از داده‌های 80 روزۀ ساعتی است؛ به گونه‌ای که این داده‌ها به سه دسته داده‌های آموزشی، صحت‌سنجی و تست تقسیم می‌شوند که از داده‌های 49 روز نخست برای آموزش و از داده‌های روز

 

جدول (2): ارزیابی نتایج پیش‌بینی در افق 1 گام به‌جلو

ARIMA

RBF

MLP

GMDH

روش

RMSE

MMAPE

RMSE

MMAPE

RMSE

MMAPE

RMSE

MMAPE

معیار ارزیابی

1.3062

0.2505

1.1285

0.2174

1.1537

0.2034

1.172

0.1594

فوریه

1.1674

0.2635

1.1311

0.2545

1.1743

0.2891

0.8769

0.2023

مه

0.9883

0.3005

0.7397

0.2199

0.6626

0.1838

0.553

0.1651

آگوست

1.2580

0.2323

1.2427

0.2249

16077

0.2532

1.2671

0.1907

نوامبر

45

90

12

4

زمان حل(ثانیه)

 

جدول (3): ارزیابی نتایج پیش‌بینی در افق 24 گام به‌جلو

 

ARIMA

RBF

MLP

GMDH

روش

RMSE

MMAPE

RMSE

MMAPE

RMSE

MMAPE

RMSE

MMAPE

معیار ارزیابی

 

3.2243

0.6771

2.1438

0.4212

2.0706

0.3491

1.4437

0.2666

فوریه

 

2.5743

0.6438

1.7437

0.3885

1.8911

0.4738

1.3371

0.2990

مه

 

2.1536

0.7110

1.1492

0.3330

0.9402

0.2598

0.8051

0.2546

آگوست

 

2.9914

0.6186

1.9468

0.3634

2.3780

0.4034

1.5977

0.2668

نوامبر

 

 

47

93

37

5

زمان حل(ثانیه)

                             

 

 

 

 

50ام برای صحت‌سنجی و از داده‌های 30 روز پایانی برای تست مدل استفاده می‌شود.

همچنین پس از آزمون و خطا تعداد جمعیت الگوریتم‌ها 50، میزان حداکثر تکرار500، معیار توقف بهبودنیافتن بعد از 50 تکرار و نرخ جهش[17] و همبری[18] به‌ترتیب 0.7 و 0.1 و نیز پارامترهای یادگیری (c1 و c2) برای pso هردو 1.4962 انتخاب شدند. کلیۀ برنامه‌ها در فضای متلب و در یک سیستم با پردازنده corei5 و حافظه 4 گیگ اجرا شده است. با توجه به شکل (5)، علاوه بر زمان اجرای شبکه، که در جدول (2) و (3) به آن اشاره شده است، می‌باید زمان صرف‌شده در مرحلۀ انتخاب متغیرهای مؤثر نیز در نظر گرفته شود که این زمان برای ماه‌های مختلف بین 10 تا 13 ثانیه متغیر است. شایان توجه است باوجود افزودن این زمان، کل زمان صرف‌شده در تکنیک GMDH همچنان کمتر از تکنیک‌های رقیب خواهد بود.

پس از آموزش و صحت‌سنجی شبکه‌های مختلف برای اطمینان از جامعیت آن براساس دو افق پیش‌بینی مختلف به پیش‌بینی مقادیر 30 روز پایانی پرداخته می‌شود؛ افق 1 ساعت و افق 24 ساعت که در افق یک ساعت (یک گام به‌جلو) از داده‌های واقعی یک ساعت گذشته استفاده می‌شود؛ ولی در افق 24 ساعت (چندگام به‌جلو)، پس از ساعت اول برای ساعات بعدی تا 24 ساعت از مقادیر پیش‌بینی‌شده به‌عنوان ورودی شبکه استفاده می‌شود.

همچنین در این مرحله به‌منظور بررسی بهتر نتایج، از ماه‌های فوریه، می، اوت و نوامبر به‌ترتیب به‌عنوان نمایندۀ فصول مختلف سال و ماه‌های تست شبکه پس از آموزش آن استفاده شده است.

در روش ARIMA به‌منظور تعیین وقفه بهینه علاوه بر استفاده از متد باکس‌جنکینز از معیار آکائیک بیزین استفاده شد است [43] و [44]. در شبکه MLP پس از آزمون و خطا از تابع فعال‌سازی Logsig و خطی به‌ترتیب در نرون‌های لایۀ پنهان و خروجی، استفاده و در شبکه RBF مقادیر حداکثر نرون و Spread برای ماه‌های مختلف به‌صورت جدول (1) انتخاب شده است. نتایج پیش‌بینی در افق 1 و 24 گام به‌جلو برای متدهای مختلف به‌ترتیب در جداول 2 و 3 ارائه شده‌‌اند. در جدول 2 و 3 سطر آخر نشان‌دهندۀ مدت زمان آموزش و پیش‌بینی شبکه است که شبکۀ عصبی GMDH در هر دو افق پیش‌بینی کمترین زمان

 

 

شکل (5): متوسط (محور سمت راست) و انحراف معیار (محور سمت چپ) برازندگی اعضاء جمعیت و زمان بهینه‌یابی

 

 

را داشته است. همچنین ارزیابی قدرت پیش‌بینی این شبکه براساس هردو معیار MMAPE و RMSE با سایر تکنیک‌ها نیز نشان‌دهندۀ قدرت پیش‌بینی بیشتر آن است.

6- نتیجه‌گیری

انرژی بادی، یکی از منابع انرژی تجدیدپذیر است که منبع جایگزین سوخت‌های فسیلی است و شایان توجه و تأکید است. با توجه به وابستگی شدید تولید انرژی بادی به تغییرات جوی و روند پرنوسان آن برای عرضۀ مطمئن آن در شبکه‌های توزیع، پیش‌بینی دقیق روند آتی آن اهمیت فراوانی دارد. با توجه به روند به‌شدت نوسانی و غیرخطی توان تولیدی واحدهای بادی، در این مطالعه سیستم هوشمند ابتکاری برای پیش‌بینی مقادیر آیندۀ تولید توان واحدهای بادی ارائه شد. در این الگوریتم ابتدا به کمک نظریۀ اطلاعات، متغیرهای مؤثر همراه با وقفه‌های بهینه شناسایی شدند و سپس به کمک آن شبکۀ عصبی خودسازمان‌ده موسوم به GMDH آموزش داده شد. شبکۀ عصبی GMDH به زمان اندکی برای آموزش نیاز داشت و ویژگی برجستۀ آن امکان تعیین ورودی‌های مؤثر در پیش‌بینی از بین داده‌های متعدد ورودی است. نتایج حاصل از شبیه‌سازی روی داده‌های واقعی مزرعه بادی سوتاونتو در اسپانیا حاکی از دقت، سرعت و توانایی زیاد مدل پیشنهادی است.

 



[1] تاریخ ارسال مقاله: 04/05/1393

تاریخ پذیرش مقاله: 19/04/1397

نام نویسندۀ مسئول: وحید وحیدی نسب

نشانی نویسندۀ مسئول: ایران ـ تهران ـ دانشگاه شهید بهشتی ـ پردیس فنی و مهندسی شهید عباسپور ـ دانشکده مهندسی برق



[1] Sustainability

[2] Global Wind Energy Council (GWEC)

[3] External Criterion

[4] Cross correlation

[5] Redundancy

[6] Mutual Information (MI)

[7] Forward feature selection

[8] Quartile Discretization

[9] Conditional Entropy

[10] Complicated, Conflicting and Multitasking

[11] Insertion

[12] Swapping

[13] Reversion

[14] Relocating

[15] Voltrra

[16] Sotavento

[17] Mutation

[18] Cross Over

[1] E. Vine, "Breaking down the silos: the integration of energy efficiency, renewable energy, demand response and climate change," Energy Efficiency, vol. 1, no. 1, pp. 49-63, 2008.
[2] W. Zhou, C. Lou, Z. Li, L. Lu, and H. Yang, "Current status of research on optimum sizing of stand-alone hybrid solar–wind power generation systems," Applied Energy, Vol. 87, No. 2, pp. 380-389, 2010.
[3] A. Strupczewski, "Accident risks in nuclear-power plants," Applied Energy, Vol. 75, No. 1–2, pp. 79-86, 2003.
[4] A. Skoglund, M. Leijon, A. Rehn, M. Lindahl, and R. Waters, "On the physics of power, energy and economics of renewable electric energy sources - Part II," Renewable Energy, Vol. 35, No. 8, pp. 1735-1740, 2010.
[5] A. Evans, V. Strezov, and T. J. Evans, "Assessment of sustainability indicators for renewable energy technologies," Renewable and Sustainable Energy Reviews, Vol. 13, No. 5, pp. 1082-1088, 2009.
[6] [ J. Lerner, M. Grundmeyer, and M. Garvert, "The importance of wind forecasting," Renewable Energy Focus, Vol. 10, No. 2, pp. 64-66, 2009.
[7] J. Lujano-Rojas, J. Bernal-Agustín, R. Dufo-López, and J. Domínguez-Navarro, "Forecast of Hourly Average Wind Speed Using ARMA Model with Discrete Probability Transformation," in Electrical Engineering and Control, vol. 98, M. Zhu, Ed. (Lecture Notes in Electrical Engineering: Springer Berlin Heidelberg, 2011, pp. 1003-1010.
[8] H. Liu, J. Shi, and E. Erdem, "Prediction of wind speed time series using modified Taylor Kriging method," Energy, vol. 35, no. 12, pp. 48 2010, 4879-70.
[9] G. N. Kariniotakis, G. S. Stavrakakis, and E. F. Nogaret, "Wind power forecasting using advanced neural networks models," Energy Conversion, IEEE Transactions on, Vol. 11, No. 4, pp. 762-767, 1996.
[10] M. C. Alexiadis, P. S. Dokopoulos, H. S. Sahsamanoglou, and I. M. Manousaridis, "Short-term forecasting of wind speed and related electrical power," Solar Energy, Vol. 63, No. 1, pp. 61-68, 1998.
[11] J. Zhou, J. Shi, and G. Li, "Fine tuning support vector machines for short-term wind speed forecasting," Energy Conversion and Management, Vol. 52, No. 4, pp. 1990-1998, 2011.
[12] P. Johnson, M. Negnevitsky, and K. M. Muttaqi, "Short term wind power forecasting using adaptive neuro-fuzzy inference systems," in Power Engineering Conference, 2007. AUPEC 2007. Australasian Universities, 2007, pp. 1-6.
[13] A. M. Foley, P. G. Leahy, A. Marvuglia, and E. J. McKeogh, "Current methods and advances in forecasting of wind power generation," Renewable Energy, Vol. 37, No. 1, pp. 1-8, 2012.
[14] A. Costa, A. Crespo, J. Navarro, G. Lizcano, H. Madsen, and E. Feitosa, "A review on the young history of the wind power short-term prediction," Renewable and Sustainable Energy Reviews, Vol. 12, No. 6, pp. 1725-1744, 2008.
[15] X. Wang, P. Guo, and X. Huang, "A Review of Wind Power Forecasting Models," Energy Procedia, Vol. 12, No. 0, pp. 770-778, 2011.
[16] S. S. Soman, H. Zareipour, O. Malik, and P. Mandal, "A review of wind power and wind speed forecasting methods with different time horizons," 2010, pp. 1-8.
[17] F. M. Reza, An Introduction to Information Theory. Dover, 1994.
[18] G. Simon and M. Verleysen, "High-dimensional delay selection for regression models with mutual information and distance-to-diagonal criteria," Neurocomputing, vol. 70, no. 7–9, pp. 1265-1275, 2007.
[19] D. François, F. Rossi, V. Wertz, and M. Verleysen, "Resampling methods for parameter-free and robust feature selection with mutual information," Neurocomputing, Vol. 70, No. 7–9, pp. 1276-1288, 2007.
[20] R. J. May, G. C. Dandy, H. R. Maier, and J. B. Nixon, "Application of partial mutual information variable selection to ANN forecasting of water quality in water distribution systems," Environmental Modelling & Software, Vol. 23, No. 10–11, pp. 1289-1299, 2008.
[21] N. Amjady and A. Daraeepour, "Design of input vector for day-ahead price forecasting of electricity markets," Expert Systems with Applications, Vol. 36, No. 10, pp. 12281-12294, 2009.
[22] N. Amjady and F. Keynia, "A new prediction strategy for price spike forecasting of day-ahead electricity markets," Applied Soft Computing, vol. 11, no. 6, pp. 4246-4256, 2011.
[23] N. Amjady, F. Keynia, and H. Zareipour, "Short-term wind power forecasting using ridgelet neural network," Electric Power Systems Research, Vol. 81, No. 12 pp, 2099-2107, 2011.
[24] A. Kazem, E. Sharifi, F. K. Hussain, M. Saberi, and O. K. Hussain, "Support vector regression with chaos-based firefly algorithm for stock market price forecasting," Applied Soft Computing, Vol. 13, No. 2, pp. 947-958, 2013.
[25] S. Guiaşu, Information theory with applications. New York: McGraw-Hill, 1976.
[26] O. Ludwig, U. Nunes, R. Araújo, L. Schnitman, and H. A. Lepikson, "Applications of information theory, genetic algorithms, and neural models to predict oil flow," Communications in Nonlinear Science and Numerical Simulation, Vol. 14, No. 7, pp. 2870-2885, 2009/07/01/ 2009.
[27] J. Dougherty, R. Kohavi, and M. Sahami, "Supervised and Unsupervised Discretization of Continuous Features," presented at the ICML, 1995. Available: http://dblp.uni-trier.de/db/conf/ icml/icml1995.html#DoughertyKS95
[28] H. Liu, J. Sun, L. Liu, and H. Zhang, "Feature selection with dynamic mutual information," Pattern Recognition, Vol. 42, No. 7, pp. 1330-1339, 7// 2009.
[29] J. D. Hamilton, Time Series Analysis. Princeton University Press, 1994.
[30] H. Peng, L. Fulmi, and C. Ding, "Feature selection based on mutual information criteria of max-dependency, max-relevance, and min-redundancy," Pattern Analysis and Machine Intelligence, IEEE Transactions on, Vol. 27, No. 8, pp. 1226-1238, 2005.
[31] J. Kennedy and R. Eberhart, "Particle swarm optimization," in Neural Networks, 1995. Proceedings., IEEE International Conference on, 1995, Vol. 4, pp. 1942-1948 vol.4.
[32] R. F. Abdel-Kader, "Hybrid discrete PSO with GA operators for efficient QoS-multicast routing," Ain Shams Engineering Journal, Vol. 2, No. 1, pp. 21-31, 2011.
[33] R. Eberhart and Y. Shi, "Comparison between genetic algorithms and particle swarm optimization," in Evolutionary Programming VII, vol. 1447, V. W. Porto, N. Saravanan, D. Waagen, and A. E. Eiben, Eds. (Lecture Notes in Computer Science: Springer Berlin Heidelberg, 1998, pp. 611-616.
[34] P. Angeline, "Evolutionary optimization versus particle swarm optimization: Philosophy and performance differences," 1998, pp. 601-610.
[35] A. Mohammadi and M. Jazaeri, "A hybrid particle swarm optimization-genetic algorithm for optimal location of svc devices in power system planning," in Universities Power Engineering Conference, 2007. UPEC 2007. 42nd International, 2007, pp. 1175-1181.
[36] J. Robinson, S. Sinton, and Y. Rahmat-Samii, "Particle swarm, genetic algorithm, and their hybrids: optimization of a profiled corrugated horn antenna," in Antennas and Propagation Society International Symposium, 2002. IEEE, Vol. 1, pp. 314-317, 2002
[37] E. Alfassio Grimaldi, F. Grimaccia, M. Mussetta, P. Pirinoli, and R. E. Zich, "A new hybrid genetical-swarm algorithm for electromagnetic optimization," in Computational Electromagnetics and Its Applications, 2004. Proceedings. ICCEA 2004. 2004 3rd International Conference on, 2004, pp. 157-160.
[38] Y.-T. Kao and E. Zahara, "A hybrid genetic algorithm and particle swarm optimization for multimodal functions," Applied Soft Computing, Vol. 8 , No. 2, pp. 849-857, 2008.
[39] A. G. Ivakhnenko, D. Wunsch, and G. A. Ivakhnenko, "Inductive sorting-out GMDH algorithms with polynomial complexity for active neurons of neural network," in Neural Networks, 1999. IJCNN '99. International Joint Conference on, 1999, Vol. 2, pp. 1169-1173 vol.2.
[40] R. W. Brockett, "Volterra series and geometric control theory," Automatica, vol. 12, no. 2, pp. 167-176, 1976/03/01 1976.
[41] A. G. Ivakhnenko, "Polynomial Theory of Complex Systems," IEEE Transactions on Systems, Man, and Cybernetics, Vol. SMC-1, No. 4, pp. 364-378, 1971.
[42] N. Amjady, F. Keynia, and H. Zareipour, "Wind Power Prediction by a New Forecast Engine Composed of Modified Hybrid Neural Network and Enhanced Particle Swarm Optimization," IEEE Transactions on Sustainable Energy, Vol. 2, No. 3, pp. 265-276, 2011.
[43] W. Vandaele, Applied time series and Box-Jenkins models. Academic Press, 1983.
[44] R. A. Yaffee and M. McGee, An Introduction to Time Series Analysis and Forecasting: With Applications of SAS® and SPSS®. Elsevier Science, 2000.