Document Type : Research Article
Authors
Abstract
Keywords
1- مقدمه[1]
ترکیب تصاویر[1] عبارت است از ادغام ویژگیهای دو یا چند تصویر، به طوری که تصویر حاصل، ویژگیهای مهم هر یک از تصاویر را شامل شود و تصویری با کیفیت و ویژگیهای کاملتر ارایه نماید [1]. ترکیب تصاویر کاربردهای گستردهایی دارد و با در دسترس بودن اطلاعات حسگرها در زمینههای مختلف، مانند عکسبرداری دیجیتال با میزان تمرکز خودکار [2]، سنجش از دور [3]، تصویربرداری پزشکی و بینایی ماشین [4]، ترکیب حسگری به یک موضوع جدید پژوهشی تبدیل شده است.در عکسبرداری، هنگامی که عدسی دوربین روی یک نقطه خاص متمرکز است، وضوح تصویر در آن نقطه بسیار خوب است، اما فضاهای دورتر از نقطه تمرکز وضوح کمتری خواهند داشت [1].تمرکز چندگانه[2] روشی قدرتمند برای ترکیب تصاویر با وضوحهای متفاوت است که در آنها تصاویر با میزان تمرکزهای مختلف گرفته شده و سپس، با یکدیگر ادغام میشوند تا تصویری با وضوح کامل حاصل شود. برای ادغام تصاویر با وضوحهای متفاوت، روشهای مختلفی وجود دارد که این روشها را میتوان به سه گروه اصلی دستهبندی کرد. نخستین دسته، روشهایی هستند که بر پایه اطلاعات پیکسلها میباشند و از جمله آنها میتوان به روشهای بیشینهگیری [5 و 6]، میانگینگیری [6 و 7] و بهکارگیری منطق فازی [8] اشاره کرد. دو روش نخست از ابتداییترین روشهای ترکیب تصاویر هستند که از ویژگیهای آنها میتوان به سرعت بالا و سادگی الگوریتم اشاره کرد، اما این روشها اصولا دقت پایینی دارند. در روش فازی کارایی بالاست، اما بهعلت سرعت پایین نمیتوان از آن در سامانههای بیدرنگ استفاده کرد. دسته دوم، روشهای مبتنی بر توابع تبدیل میباشند که بیشتر برگرفته از تبدیل فوریه هستند، مانند ترکیب تصاویر با استفاده از تبدیل لاپلاس [9- 11]، تبدیل موجک [12- 16]، IHS[3] [17] و تبدیل Brovey [18]. این روشها دقت مناسبی دارند، برای انجام کارهای تلفیقی بهکار گرفته میشوند و تبدیل موجک از پرکاربردترین آنها محسوب میشود. از آنجا که در IHS از ویژگیهای رنگ تصاویر استفاده میشود، برای تصاویر رنگی مناسب میباشند ولی در عمل بهعلت کارایی پایینتر روشهای IHS و Brovey نسبت به سایر روشها، از آنها کمتر استفاده میشود. دسته سوم از روشها نیز مبتنی بر استفاده از ترکیب اطلاعات بلوکی و روشهای پردازش و بهینهیابی هوشمند هستند.
شایان ذکر است که در سالیان اخیر، الگوریتمهای مبتنی بر رفتار موجودات یا پدیدههای طبیعی در حوزههای کاربردی گوناگون با هدف بهینهسازی استفاده شدهاند، مانند ژنتیک [19]، اجتماع زنبورها [20]، بهینهسازی مبتنی بر اجتماع ذرات[4] (PSO) [21]، خفاش [22]، کاوش باکتری [23]، و چرخه آب [24]. همچنین، نسخههای اصلاحی و آمیختار این الگوریتمها نیز بسیار مورد توجه قرار گرفتهاند، مانند اجتماع ذرات وفقی [25]، اجتماع ذرات همتکاملی اصلاحشده [26]، آمیختار الگوریتمهای جغرافیای زیستی و تکاملی تفاضلی [27]، و الگوریتم توسعهیافته بهینهیابی جفتگیری زنبورعسل [28].
از الگوریتمهای بهینهیابی فرا ابتکاری در موضوع ترکیب تصاویر نیز با اهداف مختلف استفاده شده است که نمونههایی از این اهداف را میتوان چنین برشمرد:
الف) بهینهیابی ابعاد بلوکهای تصویر [29]،
ب) بهینهسازی ضرایب وزن ترکیب [30 و 31]،
پ) آشکارسازی لبه و بهسازی در سامانههای ترکیب تصویر [32]،
ت) بهینهسازی ساختار و شاخصهای شبکه عصبی مصنوعی مورد استفاده برای ترکیب تصاویر [33 و 34].
از نمونه الگوریتمها/ مدلهای هوش محاسباتی مورد استفاده در موضوع ترکیب تصاویر نیز میتوان به این موارد اشاره کرد: ژنتیک [35 و 36]، PSO [37- 39]، تکامل تفاضلی [29]، یادگیری- تعلیم[5] [30]، تکاملی چندهدفی [31]، اجتماع مورچگان [32]، اجتماع زنبورها [33]، طوفان مغزی آشوبی[6] [34] و شبکه عصبی [40 و 41].
در این مورد الگوریتم PSO و نسخههای اصلاحی آن بیشتر استفاده شدهاند. در این پژوهش، با استفاده از فرکانس مکانی و بهینهسازی اندازه بلوکها مبتنی بر الگوریتم جستجوی گرانشی[7] (GSA)، کوشش شده است روش کارآمدی برای ترکیب تصاویر ارایه شود. لازم به یادآوری است که GSA بهعنوان الگوریتمی نوینتر و نیز با سه مزیت یاد شده در زیر نسبت به الگوریتم PSO مطرح است [42]:
الف) روال به روز رسانی در الگوریتم PSO بدون در نظر گرفتن کیفیت پاسخها انجام میشود (مقادیر برازش در این روال مهم نیستند)، حال آنکه در GSA نیرو متناسب با مقدار برازش است (عاملها فضای جستجوی پیرامون خود را با توجه به نیرو مشاهده میکنند).
ب) روال بهروزرسانی در الگوریتم PSO بدون درنظر گرفتن فاصله بین پاسخها انجام میشود، حال آنکه در GSA نیرو تناسب معکوس با فاصله بین پاسخها دارد.
پ) در الگوریتم PSO، راستا و جهت یک عامل تنها با توجه به دو موقعیت بهینه محاسبه میشود، حال آنکه در GSA این جهت بر اساس نیروی کلی حاصل از تمام عاملهای دیگر محاسبه میشود.
نکته قابل توجه این است که در هر دو الگوریتم PSO و GSA، بهینهسازی از طریق حرکت عاملها در فضای جستجو انجام میشود، هر چند که روش حرکت در این دو الگوریتم متفاوت است.
البته در این راستا، GSA با هدف افزایش دقت سامانههای بازیابی تصویر در مطالعات سالیان اخیر به کار گرفته شده است [43]. همچنین، الگوریتمهای دیگر مانند بهینهسازی مبتنی بر اجتماع گربهها نیز برتری خود را بر PSO نشان داده است [44 و 45]؛ که به تازگی در حوزه مشابه با مقاله حاضر به کار گرفته شده است [46].
ساختار این مقاله چنین است: در بخش دوم الگوریتم جستجوی گرانشی مرور شده و در انتهای این بخش نسخههای اصلاحی این الگوریتم نیز معرفی خواهند شد. بخش سوم به موضوع ترکیب تصاویر بر اساس اطلاعات فرکانس مکانی میپردازد. در بخش چهارم با تعریف مسأله در قالب یک مسأله بهینهیابی و استفاده از فرکانس مکانی به بیان روش پیشنهادی پرداخته شده است. در بخش پنجم نیز نتایج تجربی و مقایسه با سایر روشها ارایه شدهاند. در بخش ششم نتیجهگیری بیان شده است.
2- الگوریتم جستجوی گرانشی
این الگوریتم بر اساس قوانین نیوتن ارایه شده است که در آن عاملهای جستجوکننده اجرام هستند که به شکل سیارههای یک منظومه تصور میشوند و منطقه بهینه همچون یک سیاهچاله، سیارهها را به سمت خود میکشد. تبادل اطلاعات و اثرگذاری اجرام روی یکدیگر تحت نیروی گرانش انجام میشود [42].
هر جسمی جسم دیگر را به سمت خود جذب میکند و مقدار نیروی جاذبه بین دو جسم با جرمهای M1 و M2 و فاصله R، با حاصلضرب جرم آن دو جسم و عکس مجذور فاصله بین آنها متناسب است رابطه (1):
(1)
در این رابطه G ثابت گرانش نامیده می شود. این رابطه نشان میدهد که هر جسم بهواسطه نیروی جاذبه، محل و جرم سایر اجسام را درک میکند و هر جسم به نسبت میزان جرمش و فاصلهای که با دیگر اجسام دارد، روی سایر اجسام تأثیر میگذارد و به آنها نیرو وارد میکند.
بر اساس قانون اول نیوتن، هر جسم حالت سکون یا حرکت یکنواخت خود را بر روی خط راست حفظ میکند مگر اینکه تحت تأثیر نیرو یا نیروهایی مجبور به تغییر آن حالت شود. بر اساس قانون دوم نیوتن، وقتی به جسمی نیرویی وارد میشود شتابی میگیرد که به نیرو و جرم جسم بستگی دارد. رابطه بین شتاب، نیرو و جرم در رابطه (2) ارایه شده است که در آن شتاب با a نشان داده شده است.
(2)
بر اساس قانون گرانش، به هر جسم از یک مجموعه، از جانب سایر اجسام نیروهای گرانشی وارد میشود. در نتیجه، جسم به سمت برآیند این نیروها که با Fr نشان داده میشود، شتاب میگیرد. روابط بالا بیان میکنند که هر جسم، جسم دیگر را به سمت خود میکشاند اما تأثیر جسم بزرگتر و نزدیکتر بیشتر است. با درنظر گرفتن قانون جاذبه و قوانین حرکت، میزان و جهت حرکت هر جسم، توافقی است بین تأثیر نیروی ثقل وارد بر آن و سرعت فعلی جسم.
در یک سامانه ایزوله با دو جسم i و j، جسم i تحت تأثیر نیروی جاذبه جسم j شتابی برابر ai میگیرد که بر اساس رابطه (3) محاسبه میشود. Fij، مقدار نیروی گرانشی وارد بر جسم i از جانب جسم j است که مطابق رابطه (3) محاسبه میشود. در این روابط Mpi و Mii بهترتیب جرم گرانشی غیرفعال و جرم اینرسی جسم i و Majجرم گرانشی فعال جسم j هستند.
(3)
در فیزیک ثابت شده است که ضریب گرانشی با آهنگ بسیار کندی در طول زمان، بر اساس رابطه (4) کوچک میشود.
(4)
در الگوریتم جستجوی گرانشی، بهینهیابی بهکمک طرح قوانین گرانشی و حرکت در یک سامانه مصنوعی به شکل گسسته در زمان انجام میشود. محیط سامانه همان محدوده تعریف مسأله است.
در قدم اول، فضای سامانه مشخص میشود. محیط شامل یک دستگاه مختصات چند- بعدی در فضای تعریف مسأله است. هر نقطه از فضا، یک پاسخ مسأله است. عاملهای جستجوکننده مجموعهای از اجرام هستند. هر جرم چهار مشخصه دارد: موقعیت جرم، جرم گرانشی فعال، جرم گرانشی غیرفعال، و جرم اینرسی [42]. موقعیت جرم، نقطهای در فضا است که پاسخی از مسأله است. مقدار اجرام گرانشی و اینرسی، با توجه به برازندگی هر جرم تعیین میشوند.
پس از تشکیل سامانه، قوانین حاکم بر آن مشخص میشوند. فرض میشود تنها قانون گرانش و قوانین حرکت حاکم هستند. حال سامانه را به شکل مجموعهای از N جرم تصور کنید. موقعیت بعد d از جرم i با xid نشان داده شده است.
(5)
در این سامانه، در زمان t به جرم i از سوی جرم j در جهت بعد d نیرویی به اندازه Fijd(t) وارد میشود. مقدار این نیرو بر اساس رابطه (6) محاسبه میشود. Maj و Mpi بهترتیب جرم گرانشی فعال جرم j و جرم گرانشی غیرفعال جرم i میباشند، G(t) ثابت گرانش در زمان t و Rij فاصله بین دو جرم i و j میباشند. ε نیز یک عدد بسیار کوچک است.
(6)
نیروی وارد بر جرم i در جهت بعد d در زمان t (Fid(t))، بر اساس رابطه (7) برابر مجموع ضریبهای تصادفی نیروهایی است که K جرم برتر بر جرم وارد میکنند. در این رابطه randjیک عدد تصادفی با توزیع یکنواخت در بازه [0,1] است. در رابطه (7) میتوان مجموع تمام نیروهای وارد بر جسم را درنظر گرفت، اما برای بهبود قدرت کشف الگوریتم، تنها به مجموعه Kbest شامل K عضو برتر، اجازه تأثیرگذاری بر سایر اعضا داده میشود. مقدار K به شکل متغیر با زمان تعریف میشود. به این شکل که در زمان شروع تمام اجرام روی یکدیگر تأثیر میگذارند و با گذشت زمان از تعداد اعضای تأثیرگذار بر جمعیت، به شکل خطی کم میشود تا اینکه در انتها، تنها درصد کمی از بهترینهای جمعیت بر سایر اعضا نیرو وارد میکنند.
(7)
شتاب جرم i در جهت بعد d در زمان t با aid(t) و جرم اینرسی جسم i با Mii نشان داده شده است.
(8)
سرعت بعدی هر جرم برابر مجموع ضریبی از سرعت فعلی جرم و شتاب جرم تعریف می شود (رابطه 9). موقعیت جدید بعد d از جرم i بر اساس رابطه (10) محاسبه میشود. vid(t) سرعت بعد d جرم i در زمان t است.
(9)
(10)
randi و randj اعداد تصادفی با توزیع یکنواخت در بازه [0,1] هستند که برای حفظ ویژگی تصادفی بودن جستجو، استفاده شدهاند.
برای تنظیم ثابت گرانش، از یک مقدار اولیه شروع کرده، با گذشت زمان مقدار آن کاهش داده میشود. ثابت گرانش بر اساس رابطه (11)، تابعی از ثابت گرانش اولیه و زمان است. این موضوع در دنیای واقعی نیز صدق میکند و ثابت گرانش با آهنگ بسیار کندی در طول زمان کوچک میشود. در نسخه پیوسته این الگوریتم، یک پیشنهاد برای این تابع، استفاده از رابطه نمایی برای کاهش ثابت گرانش است (رابطه 12).
(11)
(12)
در رابطه (12)، G0 ثابت گرانش اولیه، α یک مقدار ثابت مثبت و T کل تکرارهای الگوریتم و بهعبارتی طول عمر سامانه است.
در این الگوریتم، اجرام گرانشی و اینرسی بر اساس رابطه (13)، برابر در نظر گرفته شده، برای تنظیم آنها، از مقدار تابع هدف اجرام بر اساس رابطه (14) استفاده میشود. مقدار اجرام بر اساس رابطه (15)، هنجار میشوند. در این روابط، به اجرام با شایستگی بهتر، جرم بیشتری نسبت داده شود.
(13)
(14)
(15)
در این روابط fiti(t) بیانگر میزان برازندگی جرم i در زمان t است. در مسائل کمینهیابی میتوان از روابط (16) و (17) برای محاسبه بهترین و بدترین مقدار شایستگی استفاده کرد. در مسائل بیشینهیابی نیز بهترین و بدترین مقدار شایستگی بر اساس روابط (18) و (19) تعریف می شوند.
(16)
(17)
(18)
(19)
در ابتدای تشکیل سامانه، هر جسم به شکل تصادفی در یک نقطه از فضا قرار میگیرد که پاسخی از مسأله است. در هر لحظه از زمان، اجرام ارزیابی شده، تغییر مکان هر جرم محاسبه شده، در زمان بعدی، جرم در آن موقعیت قرار میگیرد. جرمهای گرانشی، جرم اینرسی و ثابت گرانش نیوتن در هر مرحله بهروزرسانی میشوند. شرط توقف میتواند پس از تکرارهای مشخص، تعیین شود.
البته نسخههای اصلاحی GSA نیز در سالیان اخیر پیشنهاد شدهاند که توضیح نمونههایی از آنها در ادامه آورده شده است:
الف) کاهش پیچیدگی محاسباتی GSA استاندارد از طریق کاهش تعداد ارزیابیهای تابع هدف توسط الگوریتمی به نام GSA- خوشهبندیشده (مبتنی بر خوشهبندی جمعیت و جایگزینی هر خوشه با جرم مرکزی بهعنوان یک عامل جدید) [47]
ب) بهکارگیری نظریه مکانیک کوانتومی در GSA استاندارد به منظور جلوگیری از همگرایی زودرس به کمینه محلی [48]
پ) اعمال یک عملگر جستجوی محلی گسسته به بهترین پاسخ GSA استاندارد با یک احتمال متغیر [49]
ت) بهکارگیری عملگر فروپاشی[8] در GSA استاندارد (با اعمال به بردار موقعیت عاملها) با هدف بهبود توانایی کاوش فضای جستجو [50]
ث) بهکارگیری ترکیب روش جستجو در الگوریتم PSO و توپ- کشسان[9] برای تسریع همگرایی و نیز استفاده از عملگر جهش آشوبی برای فرار از کمینههای محلی [51]
ج) بهکارگیری یادگیری مبتنی بر تقابل[10] برای آمایش جمعیت و جهش نسل در GSA استاندارد [52]
چ) جلوگیری از همگرایی زودرس و گرفتاری در کمینههای محلی با بهکارگیری عملگر آشوبی [53 و 54] (بهعنوان نمونه با تغییر در معادله بهروزرسانی سرعت در GSA استاندارد [55])
ح) جایگزینی معادله نمایی در رابطه تابع گرانش با یک تابع تکهای- خطی بهمنظور بهبود توانایی جستجو در GSA استاندارد [56].
3- ترکیب تصاویر بر اساس اطلاعات فرکانس مکانی
در این قسمت به مرور الگوریتمی پایه برای ترکیب تصاویر بر اساس فرکانس مکانی پرداخته میشود. این الگوریتم از نظر محاسباتی ساده بوده و میتواند در کاربردهای بیدرنگ استفاده شود [57]. یادآوری میشود که فرکانس مکانی برای اندازهگیری سطح فعالیت در یک تصویر استفاده میشود. فرکانس مکانی تصویر با استفاده از معادلات ارایهشده در رابطه (20) قابل محاسبه است:
(20)
در این رابطه F تصویر نهایی و n×m مبین ابعاد تصویر است. مقدار زیاد فرکانس مکانی سطح فعالیت بالای تصویر را توصیف میکند که در نتیجه شفافیت تصویر است.
گامهای اصلی در این الگوریتم عبارتند از:
1- تجزیه تصاویر اصلی به بلوکهایی با ابعاد n×m.
2- محاسبه فرکانس مکانی برای هر بلوک.
3- مقایسه فرکانس مکانی مربوط به دو بلوک متناظر Aiو Bi و تشکیل iامین بلوک (Fi) از تصویر ترکیبی به شکل رابطه (21):
(21)
در این رابطهTh در واقع مقدار آستانه برای ایجاد محدودهای برای میانگینگیری بین دو تصویر است. این مقدار خود میتواند با استفاده از سایر الگوریتمهای بهینهیابی اصلاح شود، اما با توجه به اندازه تصاویر، مقداری بین 1 تا 2 برای آن مقدار مناسبی است [57]. منظور از نیز میانگینگیری پیکسل به پیکسل است.
4- بررسی و اصلاح نتایج ترکیب در مرحله 3. در این مرحله، هدف اصلاح مقادیر در محلهای اتصال بلوکها به یکدیگر است. انجام این مرحله برای اطمینان از عملکرد مناسب الگوریتم است و در بسیاری موارد این مرحله مد نظر قرار داده نمیشود.
4- روش پیشنهادی
با توجه به آنچه گفته شد، در این پژوهش، تلاش شده است با کمک فرکانس مکانی و بهرهگیری از الگوریتم جستجوی گرانشی، روش کارآمدی برای ترکیب تصاویر با میزان تمرکزهای مختلف ارایه شود. برای این کار در ابتدا تصاویر اصلی به بلوکهای مختلف قطعهبندی شده و سپس، فرکانس مکانی برای هر قطعه را محاسبه میشود. در بلوکهای متناظر، بلوکی که دارای مقدار فرکانس مکانی بیشتری است، بهعنوان خروجی محاسبه میشود. این قسمت همانند چیزی است که در روش ترکیب تصاویر با استفاده از فرکانس مکانی مطرح شده است. آنچه در این جا دارای اهمیت است، اندازه بلوکهاست. در ترکیب تصاویر با وضوح مختلف با استفاده از الگوریتمهای بهینهسازی، بهدنبال پیدا کردن اندازه بهینه برای قطعهبندی تصاویر هستیم. بنابراین، با یک مسأله بهینهسازی مواجهایم. در این مورد، GSA میتواند به شکل خودکار و تطبیقی، بهترین مقدار را برای اندازه بلوکهای تصویر پیدا کند. در این روش، فرکانس مکانی برای تعیین تصویر با وضوح بیشتر استفاده میشود. شکل (1) بیانکننده چگونگی عملکرد این روش است.
شکل (1): چگونگی ترکیب تصاویر با میزان تمرکزهای مختلف با استفاده از الگوریتم GSA
4-1- تولید جمعیت اولیه
برای شروع باید مسأله را در قالب GSA مدل کرد. نخستین گام تشکیل یک جمعیت اولیه برای شروع کار است. برای این منظور یک جمعیت تصادفی از اجرام ایجاد کرده که هر جرم نشاندهنده اندازه بلوک در فضاست. فضای کلی جستجو اندازه هر کدام از تصاویر است. هر جرم دارای دو بعد میباشد که بیانگر طول و عرض بلوک است. بنابراین، در رابطه (22) برای موقعیت هر جرم میتوان نوشت:
(22)
این مقادیر برای جمعیت اولیه به شکل تصادفی ایجاد میشوند و به مرور در تکرارهای بعدی مقادیر آنها تغییر کرده تا مقدار بهینه به دست آید. در این روش هر عامل، کل تصویر را بلوکبندی میکند، به عبارتی در هر تکرار، تعداد i تصویر بلوکبندیشده بررسی میشوند. مقدار تعلقگرفته به جمعیت اولیه خود میتواند بهصورتی بهینه تولید شود که در ادامه به آن پرداخته میشود. آنچه در این مرحله باید مورد توجه قرار گیرد این است که اندازه آنها نباید از فضای جستجوی تصویر که همان اندازه تصویر اصلی است، بیشتر باشد. در الگوریتم جستجوی گرانشی این مسأله درنظر گرفته میشود، اما برای جمعیت اولیه باید این محدودیت اعمال شود تا مقادیر تصادفی انتخابشده از اندازه تصویر بزرگتر نشوند.
4-2- تعیین تابع مناسب برای بهینهیابی
انتخاب تابع صحیح برای تعیین میزان وضوح هر تصویر و در حقیقت تعیین تابعی که باید برای رسیدن به تصویر مطلوب، کمینه/بیشینه شود بسیار مهم است و به گونهای طرح مسأله بهینهیابی را مشخص میکند. با توجه به اینکه میزان وضوح تصویر قرار است بهینه شود، بنابراین، تابع مسأله یا همان تابع برازش[11]، تابع فرکانس مکانی است.
تابع فرکانس مکانی در روش پیشنهادی در دو مرحله بررسی میشود. در مرحله اول، برای محاسبه مقدار وضوح هر بلوک در تصویر بهکار گرفته میشود که این مرحله مربوط به تابع بهینهیابی نیست و تنها نقش یک انتخابگر بلوک را ایفا میکند. مرحله دوم، محاسبه میزان وضوح تصویر نهایی برای هر کدام از جمعیتهاست که در اینجا، نقش همان تابع برازش در مسأله بهینهیابی را دارد.
بنابراین، تصاویر ورودی با توجه به ابعاد و اندازه جرمها تقسیمبندی میشوند. سپس، وضوح هر کدام از بلوکهای هر تصویر محاسبه میشود و بلوک با وضوح بالاتر بهعنوان بلوک متناظر تصویر ترکیبی انتخاب میشود و این انتخاب بر اساس تباین[12] تصویر بر روی قسمتهای مختلف تکرار شده و تصاویر عکسهای ترکیبشده در مرحله اول برای مقادیر اولیه ایجاد میشوند. پس از آنکه تصویر ایجاد شد، مقدار برازش هر تصویر با استفاده از فرکانس مکانی محاسبه میشود، به این ترتیب که مقدار فرکانس مکانی تصویر نهایی محاسبه شده و مقدار آن بهعنوان مقدار برازش آن تصویر یا جرم مربوط درنظر گرفته میشود. در واقع میتوان با بیانی هر یک از تصاویر را یک جرم درنظر گرفت و با بیان دقیقتر هر بلوک انتخابی را یک جرم درنظر گرفت. بهترین مقدار برازش در بین تصاویر ایجادشده بهعنوان مقدار بهترین سراسری[13] انتخاب میشود. با توجه به اینکه در این مسأله بهینهیابی بهدنبال پیدا کردن فرکانس مکانی با مقدار بیشتر هستیم، از روابط بیشینهیابی استفاده میکنیم (روابط 18 و 19).
این الگوریتم میتواند به دو شکل متوقف شود: با توجه به میزان تکرارهای تعیینشده، و یا با توجه به رسیدن به میزان خطای قابل قبول و تعریفشده. روند نمای این روش در شکل (2) نشان داده شده است.
شایان ذکر است که برای تصاویر رنگی، در ابتدا تصاویر را خاکستری کرده و سپس، تصاویر خاکستری را بررسی کرده و در پایان، بلوک رنگی متناظر با تصویر با کیفیت بالاتر جایگزین میشود. به این ترتیب تصویر ادغامی رنگی حاصل میشود.
4-3- گامهای الگوریتم پیشنهادی
1- دریافت تصاویر و تبدیل آنها به تصاویر خاکستری.
2- آمایش مقادیر جرمها و سرعتها با مقادیر اولیه تصادفی.
3- بلوکبندی تصاویر ورودی و محاسبه فرکانس مکانی هر بلوک.
4- انتخاب بلوک با فرکانس مکانی بیشتر بهعنوان خروجی.
5- ایجاد تصویر نهایی برای تمام جرمها و محاسبه فرکانس مکانی و انتخاب فرکانس مکانی بیشتر به عنوان fbest.
6- انتخاب fbest بهعنوان fbest global در صورت بیشتر بودن نسبت به تکرار قبل.
شکل (2): روندنمای روش پیشنهادی ترکیب تصاویر با استفاده از الگوریتم جستجوی گرانشی
7- محاسبه سرعت وموقعیت جرمها.
8- محاسبه G، نیرو و شتاب.
9- محاسبه سرعت وموقعیت جدید جرمها.
10- مقداردهی مجدد اجرام خارجشده از فضای جستجو.
11- تکرار مراحل قبل تا رسیدن به مقدار خطای مطلوب و یا پایان تعداد تکرارهای تعیینشده.
12- انتخاب تصویر دارای مقدار fbest global بهعنوان تصویر ترکیبی نهایی خروجی.
4-4- مقداردهی اولیه
مقادیر fbest و fbest global اولیه، صفر درنظر گرفته میشوند. تعداد جمعیت اولیه پیشنهادی 50 و بیشترین تعداد تکرار 5 بار است که این تعداد تکرار بر اساس بهینهبودن زمان و مناسب بودن خطای نهایی تعیین شده است. این مقدار با توجه به اندازه تصویر قابل تغییر است.
با توجه به اینکه در سامانه دو مقدار x و y (طول و عرض هر بلوک) مطرح است، در الگوریتم بُعد برابر 2 میباشد (یعنی d=2). باید توجه داشت که این مقادیر باید در بازه فضای جستجو که همان اندازه تصویر میباشد، تعریف شوند.
برای محاسبه مقدار G در رابطه 12، مقدار 20=α و 100=G0 در نظر گرفته شده است.
از آنجا که اندازه بلوکها مقادیر صحیح هستند، پس از ایجاد جمعیت اولیه، ابتدا مقادیر آنها تبدیل به عدد صحیح میشود. از آنجا که کل تصویر با اندازه یکسانی بلوکبندی میشود، باقیمانده حاصل تقسیم طول و عرض تصویر بر مقدار ورودی محاسبه میشود و درصورتیکه برابر صفر نباشد یک واحد از آن کم میشود و این کار تا جاییکه باقیمانده برابر صفر شود، ادامه پیدا میکند و به این ترتیب مقادیر جمعیتهای ایجادشده بر روی تصویر منطبق شده و الگوریتم برای مسأله مورد بحث اجرا میشود. برای روشنتر شدن موضوع، فرض کنیم که طول و عرض تصویر با ابعاد 325×235 باشد و یکی از مقادیر جمعیت بدینترتیب بدست آمده باشد: (7/13 2/48). بنابراین، ابتدا این مقدار گرد شده و به شکل (14 48) در محاسبات درنظر گرفته میشود. سپس، تقسیم ابعاد تصویر به مقادیر فوق انجام شده و چون باقیمانده صفر نیست، یک واحد از آن کم میشود و این کار تا جاییکه باقیمانده صفر شود، ادامه پیدا میکند. در این مورد مقادیر انتخابی (13 47) به باقیمانده صفر منجر میشوند و بنابراین، تصویر با این اندازه بلوکبندی میشود.
همانطور که پیشتر نیز اشاره شد، مقداردهی اولیه اندازه بلوکها نیز میتواند بهینه شود. بدیهی است هر چه اندازه بلوکهای تصویر را کوچکتر فرض نماییم نتیجه بهتر خواهد بود، اما آنچه مهم است اندازه بهینه بلوکهاست. ممکن است حتی تصویری با دو بلوک نتیجهای کاملا مطلوب را نیز داشته باشد و نیازی به بلوکبندی بیش از اندازه نباشد. بلوکهای بیشتر به معنای عملیات بیشتر و در نتیجه زمان بیشتر عملیات است و هدف از استفاده از الگوریتمهای بهینهیابی در این موارد نیز دقیقا مقابله با همین وضعیت است.
با توجه به بررسیهای انجامشده، مشاهده میشود که بلوکها در پایان همگی دارای اندازهای کمتر از نصف اندازه تصاویر اصلی هستند.
5- نتایج تجربی و مقایسه با سایر روشها
برای بررسی بیشتر موضوع، عملکرد روش پیشنهادی با دو روش دیگر مورد مقایسه قرار گرفته است. این روشها عبارتند از: بهینهسازی فرآیند ترکیب تصاویر به روش PSO و روش ترکیب مبتنی بر اطلاعات پیکسلها بر اساس منطق فازی. روش کار در الگوریتم PSO مشابه الگوریتم GSA است، با این تفاوت که مقادیر بهینه اندازه بلوکها به جای الگوریتم GSA، توسط الگوریتم PSO تعیین میشوند.
شاخصهای طراحی در PSO به شکل زیر میباشند: ضریبهای c1 و c2 که برای تعیین رفتار جمعی و شناختی است، مقدار 2 در نظر گرفته شدهاند. مشاهده میشود که هنگامی که این مقادیر بزرگتر از 2 باشند، سرعت ذره با مقدار بزرگتری بهروز میشود و در نتیجه ذره پرش زیادی در فضای جستجو خواهد داشت و ممکن است از محدوده جستجو خارج شود. مقدار وزن اولیه w، 1 در نظر گرفته شده است که ضریب wdamp=0.99 میباشد [58].
روش فازی پیشنهادی توسط نویسندگان در [8] نیز بهعنوان روشی مبتنی بر اطلاعات پیکسلها برای مقایسه انتخاب و نتایج آن بررسی شده است. در این روش، پیکسلهای متناظر دو تصویر با یکدیگر مقایسه شده و بر اساس منطق فازی مقدار خروجی مناسب برای پیکسل انتخاب میشود. قوانین فازی پیشنهادی بر این اساس ایجاد شدهاند که پیکسلهای با مقادیر دورتر از مقدار 128 وزن بیشتری به خود بگیرند. نحوه عملکرد این روش در شکل (3) نشان داده شده است. سامانه ممدانی فازی دارای دو ورودی (یکی برای تصویر با وضوح سمت راست و دیگری برای تصویر با وضوح سمت چپ) و یک خروجی (برای تصویر خروجی) است. ورودیها و خروجی دارای 7 تابع عضویت از مقدار 0 تا 255 و به شکل مثلثی هستند و تنها در قسمت میانی خروجی از یک تابع ذوزنقهای استفاده شده است تا اطراف مقدار 128 نوعی میانگینگیری انجام گیرد. در شکل (4) نیز نتیجه ترکیب تصاویر با سطوح خاکستری برای این سه روش نشان داده شده است. مقادیر بهینه اندازه بلوکها برای تصویر شکل (4) (با ابعاد 240×240 پیکسل) با استفاده از الگوریتم PSO، بلوکهایی با اندازههای 7×7 بدست آمد. همچنین، در روش GSA، بهترین کیفیت تصویر نهایی برای تصویر شکل (4)، بلوکهایی با اندازههای 60×8 محاسبه شد که مقادیر مربوط به فرکانس مکانی آنها و همچنین، میزان خطا با استفاده از معیار RMSE نیز در جدول (1) ارایه شده است.
شکل (3): روش مبتنی بر منطق فازی برای ترکیب تصاویر با میزان تمرکزهای مختلف [8]
شکل (4): نتیجه ترکیب تصاویر به سه روش مختلف، a) تصویر با وضوح سمت چپ، b) تصویر با وضوح سمت راست، c) تصویر واضح اصلی، d) نتیجه ترکیب به روش فازی، e) نتیجه ترکیب با بهکارگیری الگوریتم PSO، f) نتیجه ترکیب با بهکارگیری GSA
مقادیر RMSE نیز با توجه به رابطه 23 محاسبه شدهاند:
(23)
که در این رابطه، f و بهترتیب مبین تصاویر اصلی و ترکیبی هستند.
در شکل (5) مقادیر بیشینه، کمینه و میانگین تابع هدف در هر تکرار برای تصویر ارایهشده در شکل (4) در صورت استفاده از الگوریتم جستجوی گرانشی نشان داده شده است.
جدول (1): مقادیر RMSE تصاویر ترکیبی با سطوح خاکستری برای سه روش مورد بررسی در این پژوهش
معیار |
تصویر با وضوح سمت چپ |
تصویر با وضوح سمت راست |
تصویر ترکیبی به روش فازی |
تصویر ترکیبی به روش PSO |
تصویر ترکیبی به روش GSA |
فرکانس مکانی |
3862/9 |
2540/9 |
7360/10 |
7503/10 |
5964/11 |
میزان خطا (RMSE) |
1685/3 |
3028/3 |
961/0 |
3295/0 |
2670/0 |
شکل(5): مقادیر بیشینه، کمینه و میانگین تابع هدف (فرکانس مکانی) در تکرارهای مختلف GSA
آنچه در ترکیب تصاویر تا این مرحله انجام شده است، کار بر روی تصاویر سیاه و سفید بوده است. برای کار بر روی تصاویر رنگی پیشنهادهای گوناگونی داده شده است که در آنها معمولا از ابتدا بر روی تصویر رنگی کار کرده و تصاویر رنگی را با یکدیگر ترکیب میکنند [59- 61]. از آنجا که در روش پیشنهادی در این مقاله، بر روی بلوکهای تصویر کار میشود، میتوان ابتدا تصاویر را به سطح خاکستری انتقال داده و پس از تعیین اینکه بلوک مربوط به کدام تصویر وضوح بیشتری دارد، بلوک مربوط در تصویر رنگی را جایگزین کرد و به این ترتیب ترکیب تصاویر در سطح رنگی انجام میشود. به این ترتیب علاوه بر اینکه پیچیدگی کار کمتر میشود، تصویر حاصل دارای کیفیت بالاست. این روش، روشی انعطافپذیر است که میتواند با سایر روشها نیز تلفیق شود.
در ادامه نمونهای از ترکیب تصاویر رنگی با استفاده از روش پیشنهادی ارایه شده است (شکل 6). برای مشاهده بهتر، قسمتی از نتایج حاصل بزرگنمایی شده و در شکل (7) نشان داده شده است. بخش بزرگنماییشده، مرز بین ماتشدگی دو تصویر میباشد. با دقت در این تصاویر میتوان مشاهده کرد که ترکیب تصاویر بهخوبی انجام شده است. البته برای بررسی دقیقتر، مجموع مربعات خطا (MSE) نیز در جدول (2) نشان داده شده است. نتایج شهودی خطا نیز در شکل (8) نشان داده شده است. با توجه به جدول (2) و همچنین، با دقت در تصویر قسمت c (تفاضل تصویر اصلی با تصویر ترکیبی)، مشاهده میشود که الگوریتم پیشنهادی بهخوبی دو قسمت راست و چپ تصاویر را با یکدیگر ترکیب کرده است و میزان خطای آن با تصویر اصلی بسیار کم است.
در نهایت، برای بررسی عملکرد روش پیشنهادی، نتایج تجربی دیگری از ترکیب تصاویر با روشهای مختلف در شکلهای (9) تا (11) نشان داده شده است. برای مقایسه بهتر، مقادیر خطای تصویر نهایی نسبت به تصویر اصلی نیز در جدول (3) آورده شده است.
شکل(6): ترکیب تصاویر رنگی با استفاده از روش پیشنهادی، a) تصویر با وضوح سمت چپ، b) تصویر با وضوح سمت راست، c) نتیجه ترکیب با بهکارگیری GSA، d) تصویر اصلی
شکل(7): بزرگنمایی قسمتی از شکل 6 در مرز ماتشدگی، a) تصویر با وضوح سمت چپ، b) تصویر با وضوح سمت راست، c) نتیجه ترکیب با بهکارگیری GSA، d) تصویر اصلی
جدول (2): مقادیر MSE برای تصاویر رنگی با روش ترکیب تصاویر پیشنهادی
تصویر ترکیبی به روش GSA |
تصویر با وضوح سمت چپ |
تصویر با وضوح سمت راست |
معیار |
5739/0 |
8945/14 |
7792/9 |
MSE |
شکل(8): تفاضل تصاویر شکل (6) با تصویر اصلی، a) تفاضل تصویر با وضوح سمت چپ و تصویر اصلی، b) تفاضل تصویر با وضوح سمت راست و تصویر اصلی، c) تفاضل تصویر ترکیبی به روش GSA و تصویر اصلی، d) تفاضل تصویر اصلی و خودش
B |
a |
D |
c |
f |
e |
شکل (9): نتیجه ترکیب تصاویر با روشهای مختلف، a) تصویر با وضوح سمت چپ، b) تصویر با وضوح سمت راست، c) تصویر واضح اصلی، d) نتیجه ترکیب به روش فازی، e) نتیجه ترکیب با بهکارگیری الگوریتم PSO، f) نتیجه ترکیب با بهکارگیری GSA (ابعاد تصویر:325×235، اندازۀ بهینه بلوک 13×47 و fbest=55.5541)
c |
B |
a |
f |
e |
d |
شکل (10): نتیجه ترکیب تصاویر با روشهای مختلف، a) تصویر با وضوح سمت چپ، b) تصویر با وضوح سمت راست، c) تصویر واضح اصلی، d) نتیجه ترکیب به روش فازی، e) نتیجه ترکیب با بهکارگیری الگوریتم PSO، f) نتیجه ترکیب با بهکارگیری GSA (ابعاد تصویر:240×240، اندازۀ بهینه بلوک 120×240 و fbest=13.7351)
b |
a |
d |
c |
f |
e |
شکل (11): نتیجه ترکیب تصاویر با روشهای مختلف، a) تصویر با وضوح سمت چپ، b) تصویر با وضوح سمت راست، c) تصویر واضح اصلی، d) نتیجه ترکیب به روش فازی، e) نتیجه ترکیب با بهکارگیری الگوریتم PSO، f) نتیجه ترکیب با بهکارگیری GSA (ابعاد تصویر:472×631، اندازۀ بهینه بلوک 59×1 و fbest=14.7551)
جدول (3): مقادیر RMSE در روشهای مختلف ترکیب تصاویر در شکلهای (9- 11)
شماره شکل |
تصویر ترکیبی به روش فازی |
تصویر ترکیبی به روش PSO |
تصویر ترکیبی به روش GSA |
9 |
9528/0 |
1118/0 |
0301/0 |
10 |
3707/1 |
8699/0 |
2603/0 |
11 |
0730/2 |
8430/0 |
2287/0 |
6- نتیجهگیری
تاکنون روشهای مختلفی برای ترکیب تصاویر با هدف رسیدن به تصویری با کیفیت مطلوب ارایه شده است. در این مقاله، روش ترکیب مبتنی بر اطلاعات بلوکی تصاویر و تلفیق آن با الگوریتم جستجوی گرانشی (GSA) استفاده شد. در این راستا برای ترکیب تصاویر با وضوح مختلف بهدنبال پیدا کردن اندازه بهینه بلوکها برای قطعهبندی تصاویر هستیم، و در همین جاست که GSA وظیفه بهینهیابی را انجام میدهد. بدینمنظور، تابع فرکانس مکانی به عنوان تابع برازش درنظر گرفته شد.
به منظور ارزیابی روش پیشنهادی، نتایج ترکیب تصاویر به روش GSA با دو روش دیگر مقایسه شد. این روشها عبارت بودند از: بهینهسازی فرآیند ترکیب تصاویر به روش PSO و روش ترکیب مبتنی بر اطلاعات پیکسلها بر اساس منطق فازی. نتایج تجربی گویای میزان خطای کمتر روش پیشنهادی در مقایسه با دو روش دیگر است. در ضمن، روش پیشنهادی در ترکیب تصاویر رنگی نیز همچون تصاویر سیاه و سفید به شکل موفقی عمل کرد که نتایج یاد شده در شکلهای (6) تا (8) نشان داده شد.
برای ادامه پژوهش میتوان با استفاده از نظریه گرافها به بهبود روش ترکیب تصاویر با بهکارگیری الگوریتم جستجوی گرانشی پرداخت و از این طریق هر تصویر به بلوکهایی با ابعاد متفاوت بلوکبندی شده و اندازه بلوکها در یک تصویر نیز بهینه شود. از مشکلاتی که در این راستا پیشروی پژوهشها خواهد بود میتوان به وابستگی شدید تعداد جمعیت جرمها (در GSA) به اندازه تصاویر ورودی اشاره کرد که ممکن است در صورت بزرگ بودن اندازه تصویر، تعداد جمعیت زیادی نیاز شده و باعث پایین آمدن سرعت سامانه شود. همچنین، از آنجا که قرار است یک تصویر با اندازههای مختلف بلوکبندی شود، اندازه بلوکها به ویژه بلوکهای نهایی در طول و عرض تصویر بسیار به یکدیگر وابسته بوده و انتخاب محل و اندازه هر بلوک به سادگی امکانپذیر نخواهد بود که امید است با استفاده از مفاهیم گرافها این مشکلات از پیش رو برداشته و روشی کاراتر ارایه شود.
[1] تاریخ ارسال مقاله : 3/07/1393
تاریخ پذیرش مقاله : 21/06/1394
نام نویسندهی مسئول : منصور شیخان
نشانی نویسنده مسئول : ایران – تهران – مجتمع فنی و مهندسی دانشگاه آزاد اسلامی (واحد تهران جنوب) – دانشکده برق