Document Type : Research Article
Authors
1 Dept. of electrical and computer Engineering, University of Birjand, Birjand, Iran
2 1Dept. of electrical and computer Engineering, University of Birjand, Birjand, Iran
Abstract
Keywords
تغییرات یا ناپیوستگیها در اندازه مشخصههای تصویر مانند شدت روشنایی اساسا ویژگیهای ابتدایی مهمی هستند، چون اغلب نشاندهنده مرز اشیای فیزیکی درون تصویر هستند. ناپیوستگیهای محلی در شدت روشنایی از یک سطح به سطح دیگر لبه نامیده میشوند [1]. همچنین، میتوان گفت: لبهها به عنوان مکانهایی از تصویر تعریف میشوند که تغییر شدید (ناگهانی) در سطح خاکستری یا شدت رنگ در یک جهت خاص و در طول چند پیکسل محدود وجود دارد [2]. یک لبه اساسا در بین دو ناحیه آشکارا متفاوت نشانگذاری میشود که بدین معنی است که لبه مرز بین دو ناحیه متفاوت است [3]. در ادامه این مقاله، منظور از لبه، تنها تغییرات شدید در سطح شدت روشنایی است و سایر تعاریف لبه در نظر گرفته نمیشود.
دو راهکار اساسی برای آشکارسازی لبه وجود دارد: آشکارسازی دیفرانسیلی و انطباق مدل. در آشکارسازی دیفرانسیلی یک پردازش مکانی روی تصویر اصلی انجام میشود تا تصویر دیفرانسیل یا با تکیه بر تغییرات اندازه مکانی حاصل شود. سپس یک عملگر آشکارساز تفاضل اجرا میشود تا پیکسلهایی با مقدار تفاوت زیاد را بیابد. رویکرد دوم شامل انطباق ناحیهای محلی از پیکسلها با یکی از مدلهای لبه موجود است؛ اگر انطباق بهمقدار قابل ملاحظهای قانعکننده باشد، لبه در آن نقطه وجود دارد و در نهایت، یک تصویر دودویی هماندازه با تصویر اصلی که در آن پیکسلهای لبه با مقدار سیاه و سایر نقاط با سفید مشخص شدهاند، بهعنوان خروجی آشکارسازی لبه تولید میشود [1].
اکثر روشهای رایج آشکارسازی لبه، روشهایی ابتکاری هستند که مبنای ریاضی استواری ندارند. کنی [4] یک رهیافت محاسباتی برای آشکارسازی لبه پله ایدهآل، مطرح کرد و سه معیار برای سنجش کارایی آشکارساز لبه بیان کرد؛ که شامل ”آشکارسازی خوب، مکانیابی مناسب و پاسخ منفرد برای یک لبه“ بود. در روش کنی برای آشکارسازی لبه پله ایدهآل ابتدا تصویر ورودی با یک فیلتر گاوسی با انحراف معیار مشخص هموار شده و تصویر حاصل با مشتق فیلتر گاوسی در دو جهت افقی و عمودی کانوالو میشود. سپس با توجه به اطلاعات اندازه و زاویه بهدست آمده و استفاده از الگوریتم حذف نقاط غیر ماکزیمم و آستانهگیری دو سطحی (هیسترزیس) لبهها آشکار میشوند.
علیرغم این که امروزه روش کنی یکی از پرکاربردترین روشهای آشکارسازی لبه است، نیاز آن به تنظیم یا تعیین پارامترهای ورودی (بهویژه عرض میدان دریافت) از جمله مشکلات این روش است. چنانچه مقدار انحراف معیار مربوط به تابع گوسی (عرض میدان دریافت) بزرگتر انتخاب شود، لبههای مربوط به ساختارهای ریز از بین میرود؛ در مقابل چنانچه عرض میدان دریافت کوچکتر انتخاب شود، اثر بیشتری از نویز به خروجی منتقل خواهد شد.
در سالهای گذشته، مسأله آشکارسازی لبه همواره مورد توجه محققان بوده و با وجود کارهای زیاد انجام شده در این زمینه، تا کنون راهحل مناسب و جامعی برای آشکارسازی دقیق لبههای تصویر بدون توجه به مقیاس یا شکل لبه ارائه نشده است [3]. همچنین، در سالهای اخیر انواع روشهای هوشمند آشکارسازی لبه نیز بررسی شدهاند. استفاده از اتوماتای سلولی فازی [5]، آشکارسازی فازی رقابتی [6]، استفاده از سیستمهای فازی نوع دوم [7]، استفاده از سیستم فازی- عصبی [8]،تبدیل موجک چند مقیاسی [9]، مشتقات بولین [10] و الگوریتم جستجوی مورچگان [11] از جمله روشهای مبتنی بر هوش مصنوعی برای آشکارسازی لبه است. علیرغم اینکه روشهای هوشمند آشکارسازی لبه کارایی قابل قبولی برای آشکارسازی لبه از خود نشان دادهاند، عیب این روشها این است که نقشه لبه بهدست آمده در بیشتر موارد ضخیم است، نقاط لبه به دقت مکانیابی نمیشوند و بهعلاوه هزینه محاسباتی زیادی نیز دارند که استفاده از آنها را در کاربردهای صنعتی با محدودیت مواجه میسازد. به طور کلی، اینکه چند نوع لبه مختلف را میتوان آشکار کرد و چگونه باید یک لبه خاص را تشخیص داد، همچنان موضوعات چالش برانگیزی هستند [12].
در این مقاله یک روش هوشمند برای آشکارسازی لبه ارائه شده که تمامی قابلیتهای خوب آشکارساز لبه کنی را داراست و در آشکارسازی توام لبههای ریز و درشت و مکانیابی دقیق آنها بهخوبی عمل میکند. برای برطرف کردن تضاد ذاتی بین آشکارسازی و مکانیابی لبه با تفکیک لبه از نویز، روش پیشنهادی از فیلترهای چند مقیاسی برای تخمین دقیقتر مقدار گرادیان شدت روشنایی استفاده کرده است. این در حقیقت همان کاری است که سیستم بینایی انسان برای مشخص کردن لبههای اجسام انجام میدهد.
این مقاله به صورت زیر پیکربندی شده است: در بخش دوم مرور مختصری روی عملکرد سیستم بینایی و جنبههایی که با مساله آشکارسازی لبه مرتبط هستند، انجام شده است. همچنین مدلهای موثر برای عملکرد سلولهای نرونی حساس به لبه در این بخش بیان شدهاند. کلیات الگوریتم پیشنهادی و توضیح جزئیات مراحل این الگوریتم در بخش سوم بیان شده است. در بخش چهارم یک روش نوین برای بررسی و مقایسه کارایی دو یا چند آشکارساز لبه با استفاده از الگوریتم ژنتیک معرفی شده است. و سرانجام در بخش پنجم، نتایج حاصل از پیادهسازی روش پیشنهادی و بهترین نتایج بهدست آمده از روش کنی و مار-هیلدرث مقایسه شدهاند. بررسی نتایج و بحث و نتیجهگیری نیز در ادامه بخش پنجم ارائه شدهاند.
سیستم بینایی انسان قادر است با سرعت و دقت بالا تحلیل جامعی از منظره پیشرو ارائه دهد. عملگرهای بسیار زیاد سیستم بینایی قادر هستند در زمانی کوتاه تمامی پردازشهای لازم را روی تصویر دریافتی انجام دهند. بیشتر الگوریتمهای پردازش تصویر که بر اساس عملکرد سیستم بینایی توسعه یافتهاند، در بین الگوریتمهای مشابه از کارایی بیشتر برخوردارند. در این مقاله تنها بر جنبه استخراج لبه در سیستم بینایی انسان و توسعه الگوریتمی برای مدلسازی هوشمند این جنبه تمرکز شده است.
بسیاری از سلولهای کورتکس اولیه بینایی به لبه یا خط موجود در میدان دریافتشان (نواحی مشخصی از میدان دید) که در جهت خاصی امتداد داشته باشد، پاسخ میدهند. هابل و ویزل [13] برای نخستین بار نام سلول ساده را برای سلولهای حساس به لبه یا خط در یک جهت خاص انتخاب کردند. این سلولها به کنتراست خطوط یا لبهها حساساند. سپس مدلهای محاسباتی برای شبیهسازی عملکرد این نرونها پیشنهاد شدند [14]، داگمن [15] نشان داد که مدلسازی سلولهای ساده بینایی با استفاده از فیلتر گابور میسر است.
یک سلول ساده را میتوان با یک گروه از توابع گابور دو بعدی مدل نمود. تابع میدان دریافت (پاسخ ضربه) سلول ساده که مرکز آن در مبدا مختصات است، با رابطه (1) بیان میشود.
(1) |
که در آن:
(2) |
در رابطه (1) مقدار نسبت نمود تابع نام دارد و میزان بیضوی بودن میدان دریافت را مشخص مینماید. انحراف معیار استاندارد است که مشخص کننده اندازه میدان دریافت است. پارامتر مقدار طول موج تابع و مشخص کننده فرکانس فضایی تابع کسینوسی است. پارامتر فاز اولیه تابع گابور و نشان دهنده میزان تقارن تابع است و مولفه زاویهای در رابطه (2) جهت تابع گابور را مشخص مینماید.
اگر پاسخ تحریک سلول ساده به میدان دریافت باشد و شدت روشنایی را با تابع نشان دهیم، پاسخ تحریک سلول ساده از رابطه (3) بهدست میآید:
(3) |
روش پیشنهاد شده برای آشکارسازی لبه شامل چندین مرحله است که در چیدمان حساب شده بهصورت سری و موازی روی تصویر ورودی انجام میشود. تمامی مراحل این الگوریتم مبتنی بر مشاهدات نروفیزیولوژیک انجام شده روی سلولهای مختلف سیستم بینایی و الهام گرفتن از نحوه ارتباط این سلولها با یکدیگر است. جنبههای سیستم بینایی الهام بخش در ارائه این مدل، تحلیل جهتی و چند مقیاسی در سیستم بینایی انسان هستند. مراحل الگوریتم پیشنهادی به صورت نمودار بلوکی در شکل (1) نمایش داده شده است. همان گونه که در شکل (1) نشان داده شده است، پس از هموارسازی برای رفع نویز به وسیله فیلتر گاوسی ، تحلیل جهتی مطابق روش نشان داده شده در شکل(2) انجام میگردد. پاسخ سلولهای ساده در جهت ترجیحی که محاسبه شده است. با افزایش آشکارسازی بهبود مییابد، ولی حجم محاسبات نیز به مقدار قابل ملاحظهای افزایش مییابد. با توجه به شبیهسازیهای انجام شده، در این تحقیق برگزیده شده است. با افزایش تعداد جهتها بدون اینکه تغییر چشمگیری در کارآیی آشکارساز حاصل شود، حجم محاسبات به میزان زیادی افزایش مییابد. در بسیاری از کارهای مشابه برای شبیهسازی حساسیت جهتی سلولهای بینایی نیز شش جهت ترجیحی انتخاب شدهاند [14]. پس از آستانهگذاری غیرخطی روی پاسخ سلول ساده خروجیهای آستانهگذاری با هم جمع برداری شده، تقریبی از بردار گرادیان بهدست میآید. با تحلیل جهتی در سه مقیاس مورد نظر و به دست آمدن تخمین گرادیان در هر مقیاس، باید اطلاعات این سه مقیاس با هم ادغام شود. در این مقاله برای این منظور یک سیستم استنتاج فازی از نوع ممدانی با سه ورودی، یک خروجی و توابع عضویت ورودی و خروجی گاوسی طراحی شده است. سیستم تصمیمگیری فازی ارائه شده برای تحلیل چند مقیاسی، خروجیهای تحلیل جهتی در سه مقیاس گفته شده را در ورودی دریافت و تخمینی از گرادیان چند مقیاسی در خروجی مهیا میکند. برای طراحی قوانین فازی از سیستم درک تصویری انسان الگوبرداری شده است؛ به این ترتیب که نخست لبههای درشت وسپس لبههای ریز تشخیص داده شدهاند؛ مثلا اگر در یک نقطه، خروجی فیلتر درشتمقیاس بزرگ باشد، بدون توجه به سایر مقیاسها، آن نقطه لبه در نظر گرفته میشود؛ اما اگر خروجی فیلتر ریزمقیاس زیاد است، تنها درصورتی آن نقطه را لبه در نظر میگیرد که خروجی مقیاس میانه عدد بزرگی باشد. قواعد تصمیمگیری فازی برای انجام این مرحله در جدول (1) نشان داده شده است. مشخصات روش سیستم استنتاج فازی نیز در جدول (2) آمده است.
تصویر اصلی |
تحلیل چند مقیاسی با استفاده از مدل فازی سلولهای آماکرین و عقدهای شبکیه |
نازکسازی و آستانهگذاری دوسطحی |
تصویر لبهها |
تحلیل جهتی در مقیاس بزرگ |
هموارسازی |
تحلیل جهتی در مقیاس متوسط |
تحلیل جهتی در مقیاس کوچک
|
شکل (1): نمودار بلوکی روش پیشنهادی برای آشکارسازی لبه |
تصویر هموار شده در مقیاس مورد نظر |
آستانهگذاری غیرخطی |
آستانهگذاری غیرخطی |
آستانهگذاری غیرخطی |
شکل (2): نمودار بلوکی تحلیل جهتی
جدول (1): قواعد فازی مورد استفاده برای تحلیل چند مقیاسی
Strong |
high |
None |
None |
||
Strong |
Medium |
High |
None |
||
Strong |
Medium |
Medium |
High |
||
Weak |
Low |
Low |
High |
جدول (2): مشخصات سیستم فازی طراحی شده
Defuzzification |
Aggregation |
Implication |
OR |
AND |
centroid |
max |
min |
max |
min |
با توجه به مقدمات یادشده در مرحله نخست یک سیستم فازی نمونه طراحی شد. سپس با مقایسه خروجی سیستم فازی و تصویر مرجع لبه، پارامترهای توابع عضویت برای دستیابی به نتیجه مطلوب تغییر داده شدند؛ البته شایان ذکر است که سیستم فازی طراحیشده، بهترین سیستم ممکن نیست و میتوان به عنوان یک کار تکمیلی به بهینهسازی سیتم فازی با استفاده ازالگوریتمهای جستجوی هوشمند اقدام نمود.
با توجه به اینکه الگوریتم کنی به طور گستردهای به عنوان روش استاندارد آشکارسازی لبه به کار میرود، برای داشتن مقایسهای بهتر بین روش پیشنهادی و روش کنی، پس از به دست آمدن تخمین نهایی گرادیان چندمقیاسی در خروجی سیستم فازی، با انجام پس پردازشهای معرفیشده توسط کنی خروجی سیستم فازی نازک سازی میشود تا تصویر لبه نهایی حاصل گردد.
اگر مجموعه پیکسلهای لبه و مجموعه پیکسلهای زمینه در تصویر گراند-تروث و مجموعه پیکسلهای لبه و مجموعه پیکسلهای زمینه در تصویر لبه آشکارشده باشد؛ یا مجموعه پیکسلهای لبه درست آشکارشده از رابطه (4) بهدست میآید.
(4) |
و EF یا پیکسلهای لبه نادرست آشکارشده از رابطه (5) به دست میآیند:
(5) |
اکنون معیار سنجش کارآیی با رابطه (6) تعریف میشود:
(6) |
روشهای سنجش کارآیی عملکرد آشکارسازها را می توان بر اساس استفاده از تصاویر طبیعی یا مصنوعی و استفاده یا عدم استفاده از تصاویر گراند-تروث دستهبندی کرد[16]. در این مقاله برای سنجش عملکرد آشکارسازهای لبه گوناگون، با تکیه بر تصاویر گراند-تروث و به کمک الگوریتم ژنتیک روشی جدید برای سنجش کارآیی آشکارسازهای لبه طراحی شده است.
با توجه به اینکه الگوریتم ژنتیک بر اساس مینیمم کردن تابع هزینه عمل میکند، باید به نحوی هزینه تصویر لبه را به دست آورد. تابع هزینه با استفاده از رابطه (7) محاسبه میشود.
(7) |
برای بهینه سازی روش کنی بر اساس تصاویر گراند-تروث، تابع الگوریتم ژنتیک سه متغیر آستانه پایین، آستانه بالا و انحراف معیار را به عنوان ورودی میپذیرد و با توجه به تابع هزینه تعریف شده بهترین پارامترها را برمیگزیند. پارامترهای الگوریتم ژنتیک با استفاده از مقادیر داده شده در جدول (3) انتخاب شدهاند.
جدول (3): مقادیر پارامترهای الگوریتم ژنتیک
[0.001 ,0.09 ,0.4] |
lower bound |
[0.5 ,0.99,5.5 ] |
upper bound |
0.50 |
Crossover Fraction |
50 |
Population Size |
100 |
Generations |
با توجه به اینکه الگوریتم ژنتیک یک روش جستجوی تصادفی است و نتایج آن در هر بار اجرا متفاوت است، برای به دست آوردن پاسخ بهینه، الگوریتم ژنتیک ده بار اجرا و بهترین نتیجه به دست آمده، برگزیده شده است.
در این بخش نتایج حاصل از روش پیشنهادی برای تعدادی از تصاویر گراند-تروث با بهترین نتایج حاصل از روش کنی و روش مار-هیلدرث که با استفاده از الگوریتم ژنتیک به دست آمدهاند، مقایسه میشود. تصاویر به کار رفته از مجموعه تصاویر بانک داده [26] انتخاب شدهاند. نتایج حاصل در شکل آمده است.
تصویر اصلی |
|||
تصویر معیار |
|||
بهترین نتیجه کنی |
|||
بهترین نتیجه مار-هیلدرث |
|||
نتیجه روش پیشنهادی |
|||
|
Buffalo |
Elephant |
Golfcart |
شکل(1): بهترین نتایج حاصل از روش کنی و مارهیلدرث از نظر معیار کارایی در مقایسه با روش پیشنهادی
همانگونه که در تصاویر شکل) نیز آشکار است، بهترین نتیجه روش کنی به قیمت از دست دادن بسیاری از لبههای ساختارهای ریز بهدست آمده است. همچنین، روش مار-هیلدرث به هیچ عنوان نتوانسته است لبههای اضافی ساختارهای ریز را حذف کند و اطلاعات اضافی زیادی تولید کرده است؛ اما روش پیشنهادی به خاطر استفاده همزمان از اطلاعات مقیاسهای ریز، میانه و درشت توانسته است با حفظ لبههای مفید ساختارهای ریز و درشت، کارآیی قابل قبولی در تصاویر آزمون از خود نشان دهد. برای مقایسه بهتر، معیار کارایی هر کدام از سه آشکارساز کنی، مار-هیلدرث و چندمقیاسی برای هر کدام از تصاویر پیشین با استفاده از رابطه (6) محاسبه شده و در جدول (4) آورده شده است.
جدول (4): معیار کارایی به دست آمده برای تصاویر آزمون
تصویر روش |
بوفالو |
فیل |
ماشین گلف |
|
کنی |
بهترین |
2286/0 |
2385/0 |
2973/0 |
انحراف معیار |
0005/0 |
0002/0 |
0018/0 |
|
میانگین |
1643/0 |
1552/0 |
1424/0 |
|
بدترین |
1228/0 |
1273/0 |
0841/0 |
|
مار-هیلدرث |
بهترین |
1673/0 |
1802/0 |
2486/0 |
انحراف معیار |
0045/0 |
0008/0 |
0022/0 |
|
میانگین |
0720/0 |
0891/0 |
1325/0 |
|
بدترین |
0214/0 |
0418/0 |
0632/0 |
|
چندمقیاسی |
2577/0 |
2702/0 |
3101/0 |
در این مقاله روشی جدید برای آشکارسازی لبه در تصاویر دیجیتال بر پایه مدلسازی عملکرد سلولهای ساده و مدلسازی فازی تحلیل چندمقیاسی تصاویر در کورتکس اولیه بینایی معرفی شد. روش معرفی شده با الگو گرفتن از سیستم بینایی انسان به خوبی لبههای ساختارهای ریز و درشت را آشکار میکند. نتایج پیادهسازی الگوریتم معرفی شده روی تصاویر آزمایشی نشاندهنده دقت قابل قبول روش پیشنهادی است.