نوع مقاله : مقاله پژوهشی فارسی
نویسندگان
1 کارشناسی ارشد، دانشکدة فنی و مهندسی رسانه - دانشگاه صداوسیما - تهران - ایران
2 عضو هیأت علمی گروه مخابرات و فناوری اطلاعات، دانشکدة فنی و مهندسی رسانه - دانشگاه صداوسیما- تهران - ایران
3 عضو هیأت علمی گروه صدا، دانشکدة فنی و مهندسی رسانه - دانشگاه صداوسیما ـ تهران - ایران
چکیده
کلیدواژهها
موضوعات
عنوان مقاله [English]
نویسندگان [English]
QoS analysis in VoIP traffic is an inevitable part in multimedia networks quality improvement. Users’ acceptable VoIP quality requirement and providers’ efforts in decreasing costs and satisfying VoIP users has led researchers study in quality improvement and resource utilization field. In this article, a new approach is introduced to improve VoIP quality adaptively and decrease consumed bandwidth as far as possible. To this end, an algorithm is proposed and some intelligent modifications are carried out in sent voice packets parameters from sender side culminating in increasing received voice quality in the receiver side and decreasing consumed bandwidth. Moreover, the proposed algorithm determines types of variations and its amount in different voice quality classes. These classes are introduced using comparison among different quality types, namely, Instantaneous Quality, Perceptual Quality and Integral Quality. Inceasing VoIP network Quality, decreasing consumed bandwidth, determining appropriate quality improvement decisions in an adaptive VoIP network are accoplishments of this article.
کلیدواژهها [English]
امروزه با پیشرفتهای وسیع در حوزة ارتباطات اجتماعی، توجه به تکنیکهای فنی این مقوله جایگاه ویژهای پیدا کرده است؛ بهطوریکه انجام تحقیقات و آزمایشهای متعدد در این راستا روزانه افزایش مییابد و ابعاد جدیدی را دربرمیگیرد. بر این اساس، کاهش هزینة ارتباط و افزایش کیفیت برقراری ارتباط، دو چالش اساسی پیش روی محققان است. بررسی این دو موضوع نوعی چالش محسوب میشود؛ زیرا تحقق همزمان آنها دشوار است و مشکلاتی را پیش روی خود دارد. افزایش چشمگیر برقراری ارتباط در بستر IP نیز مهندسان و پژوهشگران این حوزه را به کنکاش در ایجاد مصالحه در این موضوعات واداشته است. ارسال صدا در بستر شبکه نیز نیازمند واکاوی دقیق برای بهبود کیفیت و کاهش هزینه است. درگذشته برای انتقال صدا از شبکههای سوییچینگ مداری[1] استفاده میشد. در این دسته از شبکهها، به هنگام برقراری ارتباط بین فرستنده و گیرنده، پهنای باند خاصی برای این انتقال تخصیص داده میشود. ناتوانی این شبکهها در تغییر میزان پهنای باند تخصیص دادهشده باوجود کیفیت مطلوب ارتباط، موجب پدیدارشدن شبکههای سوییچینگ بستهای شد. این شبکهها موجب استفاده مناسب از پهنای باند میشود؛ اما با توجه به میزان دادههای انتقالی، ممکن است کیفیت مطلوب کاربران را تأمین نکند. با ظهور شبکههای سوییچینگ بستهای[2]، چالشهایی در زمینة کیفیت صدا پدیدار شد؛ زیرا کاربران این نوع شبکهها انتظار داشتند کیفیت صدای منتقلشده در بستر شبکههای سوییچینگ بستهای با کیفیت صدای انتقالیافته در بستر شبکههای سوییچینگ مداری برابری کند؛ شبکههایی که همواره از پهنای باند لازم برای انتقال صدا برخوردار هستند؛ بنابراین کاربران که رضایتمندی آنها اصل و اساس میزان کیفیت صدا است، کیفیت صدای انتقالیافته در شبکههای سوییچینگ مداری را مبنایی برای بررسی کیفیت مطلوب در نظر میگیرند؛ ازاینرو، همواره مطالعاتی بر چگونگی ایجاد کیفیت بهتر انتقال VoIP[3] انجامگرفته است و روزبهروز روشها و ایدههای جدیدی ارائه میشود که گاه مکمل ایدهها و روشهای پیشین است تا در انتقال صدا از فرستنده به گیرنده مطلوبترین کیفیت را به دست آورد. همة موارد ذکرشده، موجب شده است بهبود روزافزون کیفیت VoIP به یکی از بزرگترین چالشهای دنیای کنونی ارتباطات در شبکه تبدیل شود. نکتة حائز اهمیت، انتخاب پارامترهای تأثیرگذار بر کیفیت صدا در بستر شبکه است. بررسی این پارامترها بهتنهایی راهگشا نخواهد بود و درنظرگرفتن همزمان مجموعة پارامترها میزان صحت تحلیل انجامشده را افزایش میدهد. برای مثال، اگر میزان تلفات بسته زیاد باشد، کیفیت افت خواهد کرد؛ اما کمبودن میزان تلفات بسته، کاهش کیفیت را تضمین نمیکند. کیفیت ارزیابیشده باید متأثر از پارامترهای گوناگونی چون تأخیر انتها به انتها، تلفات بسته و مشخصات کدک استفادهشده باشد. در راستای بهبود کیفیت انتقال صدا در بستر شبکه، پژوهشهای متعددی صورت گرفته است که گاه پارامترهای تأثیرگذار بر کیفیت صدا را بهبود میدهد و گاه کیفیت سرویس شبکه را بهبود میبخشد. در تعدادی دیگر از مقالات و پژوهشها، بهبود کیفیت انتقال صدا در بستر IP در هر دو حوزة نامبردهشده رخ میدهد. در پژوهشی، بکور[4] [1] و همکارانش برای بررسی واپیچش هماهنگ[5]، گفتار را پردازش کردند؛ به این ترتیب که پهنای باند باریک را به چهار زیر باند[6] تقسیم کردند. بازههایی هندسی، فرکانسهای گوشة این چهار زیر باند را انتخاب کردهاند. آنها برای بررسی تأثیر واپیچش هماهنگها از ارزیابیهای کمی[7] استفاده کردند و دریافتند که بیشترین تأثیرگذاری بر کیفیت گفتار بر عناصر موجود در اولین زیرباند واقع میشود؛ زیرا عناصر فرکانس پایین در مقایسه با عناصر فرکانس بالا انرژی بیشتری دارند؛ بنابراین فیلترشدن عناصر فرکانس پایین موجب ازدسترفتن انرژی بیشتری میشود و درنتیجه کاهش چشمگیری در کیفیت گفتار ایجاد میشود. علاوه بر پژوهش فوق، نوواک[8] [2] برای بررسی تأثیر تلفات بسته بهصورت منفرد و متوالی، گفتار را پردازش کرد. وی در این بررسی، با بهکارگیری الگوریتم پیشنهادی خود با مقایسة ازدسترفتن متوالی و منفرد بستهها و انجام ارزیابیهای ادراکی[9] و کمی، با فرض طول قاب[10] یکسان، تعداد بستة متوالی ازدسترفته را به دست آورده است که به کاهش کیفیت به اندازة یکسان با ازدسترفتن یک بسته منفرد منجر میشود. ریچارد تامسون[11] [3] تأثیر چند پارامتر بر کیفیت VoIP را زیر ذرهبین قرار داد و با شبیهسازی شبکهای، تأثیرات ناشی از تغییرات اندازه بسته و فشردهسازی و تغییرات حجم ترافیک پسزمینه را بر کیفیت VoIP ارزیابی کرد. وی همچنین با توجه به اهمیت کدکهای مختلف استفادهشده در شبکه ازجمله G.711، G.729 و G.723 تأثیر آنها را بر پارامترهای تأثیرگذار بر کیفیت VoIP ازجمله ژیتر، تعداد بسته حذفشده، تأخیر انتها به انتها [12] و... ارزیابی کرد. در پژوهشی دیگر [4] پارامترهای تأثیرگذار بر کیفیت صدا با الگوریتمی ارزیابی میشود که از فیدبک بهره میبرد و کیفیت گفتار دریافتی در گیرنده را بهصورت پله به پله افزایش میدهد که درنتیجة آن و با توجه به حافظه شنیداری مخاطبان رضایت بیشتری از کیفیت شنیدهشده حاصل میشود. در [5] پژوهشگران راهحلی برای ارتباطدادن لایه فیزیکی به پارامترهای کیفیت سرویس لایة کاربردی ارائه دادهاند تا رابطة کیفیت سرویس و کیفیت تجربه[13] را بهینه کنند. در پژوهشی دیگر، محمد عامر[14] [6] تأثیر اندازة قابهای موجود در بسته بر کیفیت صدا را بررسی کردند و با توجه به بررسی تأثیر کدکهایی چون G711، G729 و G723 بر پارامترهای تأثیرگذار بر کیفیت VoIP نتایجی شایان توجه به دست آورد. در [7] نویسندة مقاله، عملکرد VoIP را در شبکههای بیسیم ارزیابی کرده که متشکل از دو فاز است. در فاز اول، بستههای صدا را از شبکههای عادی بیسیم عبور میدهد و در فاز دوم، سناریوهایی انتخاب و تأثیر پارامترهای کیفیت سرویس بررسی میشود. در [8] بزرگترین مطالعة اندازهگیری کیفیت VoIP با پیادهسازی تعداد زیادی ارزیابی ادراکی صورت گرفته است که با بهرهگیری کدکهای G.711 و G.729، انجام و در بستری واقعی پیادهسازی شده است؛ همچنین مدلی جدید برای ارزیابی کیفیت VoIP به دست آمده است که دقتی بیش از E-Model [9] در مدلسازی معیار MOS[15] دارد. در [10] مدلی برای شبیهسازی ترافیک واقعی ارائه میشود. مدل پیشنهادشده برای تولید ترافیک VoIP بهطور همزمان ویژگیهای الگوریتمهای کدگذاری صدا و رفتار کاربری را برای تولید جریانی از بستهها به خدمت میگیرد که رفتار کاربری را با بررسی مجموعههایی از داده برگرفته از دو سیستم تجاری VoIP در مدت سه سال توصیف میکند. ویژگی اصلی این مدل، قابلیت پارامتربندی آن است که با اندازهگیریهای ساده در شبکه به دست میآید. در این مقاله نیز الگوریتمی برای بهبود کیفیت صدا ارائه میشود تا کیفیت صدا را بهصورت وفقی مدیریت کند و با کاهش پهنای باند مصرفی کیفیت صدای دریافتشده در فرستنده را افزایش دهد. بدین شکل، الگوریتم موجود با توجه به کیفیت ارزیابیشده در سمت گیرنده، تغییراتی را از سمت فرستنده بر پارامترهای تأثیرگذار اعمال میکند و عملکرد خود را نیز بهبود میبخشد.
الگوریتم ارائهشده و ویژگیهای آن
همانطور که پیشتر اشاره شد، هدف اصلی از ارائة الگوریتم، افزایش کیفیت صدای دریافتی در سمت گیرنده و کاهش منابع مصرفی است. در [11] الگوریتمی ارائه میشود تا کیفیت صدای دریافتی در گیرنده را بهبود بخشد. در این روش هیچ تلاشی برای کاهش پهنای باند مصرفشده نمیشود و با تغییر شرایط شبکه، کارآیی الگوریتم کاهش مییابد؛ همچنین برای رسیدن به کیفیت مطلوب در شرایط ثابت، تصمیماتی بهطور پیشفرض انتخاب میشوند که در مدت دریافت صدا در گیرنده این تصمیمات تغییر نمیکنند. الگوریتم پیشنهادی علاوه بر افزایش پلهای کیفیت صدا در گیرنده که موجب افزایش رضایت کاربران است، پهنای باند مصرفی را نیز تا حد امکان کاهش میدهد و با تغییر شرایط شبکه، تصمیمات خود برای بهبود کیفیت را بهروزرسانی میکند. استفاده از این الگوریتم تأخیر انتها به انتها را نیز کاهش میدهد [4]. در ادامه، نحوة عملکرد الگوریتم پیشنهادی بررسی شده است. گفتار یا صدای موجود در تماس به تکهصحبتهایی تبدیل میشود. در ابتدا تکهصحبت از سمت فرستنده ارسال میشود و از بستر شبکه عبور میکند و به گیرنده میرسد. در گیرنده با بهکارگیری ابزار محاسباتی E-Model، کیفیت لحظهای تکهصحبت دریافتی با توجه به پارامترهای مؤثر، سنجیده و با کیفیت ادراکی و بیشینة کیفیت بهدستآمده ناشی از بهکارگیری کدک استفادهشده مقایسه میشود. این مقایسه وضعیت کیفیت تکهصحبت دریافتی را در چند دسته مختلف قرار میدهد. حال با توجه به اینکه کیفیت لحظهای هر تکهصحبت در کدام دسته قرار گرفته است، گیرنده تصمیماتی را اتخاذ میکند و آنها را برای اعمال به فرستنده ارسال میکند. فرستنده نیز دستورات دریافتی را بر تکهصحبت بعدی، اعمال و آن را ارسال میکند. تصمیمات اتخاذشده از طرف گیرنده عبارتند از: کاهش و افزایش نرخ بیت و همچنین کاهش و افزایش طول بستههای صدا. الگوریتم در قبال تصمیمات اتخاذشده از سمت گیرنده هوشمند است؛ بهطوریکه اگر تصمیمی در گیرنده به بهبود کیفیت و یا کاهش پهنای باند مصرفی منجر نشود، این تصمیم اولویت انتخاب پایینی دارد و در این حالت، الگوریتم میداند که اگر تکهصحبت در شرایطی مشابه قرار گرفت، باید تصمیم دیگری اتخاذ کند. بدین گونه است که الگوریتم رفتار خود را اصلاح میکند. همانطور که اشاره شد، در گیرنده کیفیتهای لحظهای، ادراکی و بیشینه با یکدیگر مقایسه میشوند. کیفیت لحظهای QI کیفیتی است که تکهصحبت در لحظة رسیدن به گیرنده دارد و کیفیت ادراکی QT نیز بر پایه مدل AT&T [12] به دست میآید. طبیعی است که اگر کیفیت لحظهای هریک از تکهصحبتها از کیفیت ادراکی کمتر باشد، شنونده از کیفیت صدای انتقالیافته در بستر شبکه رضایت نخواهد داشت؛ ازاینرو، بالاتر یا پایینتربودن کیفیت لحظهای هر تکهصحبت از کیفیت ادراکی به ملاحظاتی نیاز دارد که در ادامه به آنها خواهیم پرداخت. همانطور که در جدول (1) مشخص است کیفیت لحظهای تکهصحبت فعلی با کیفیت لحظهای تکهصحبتهای قبلی، کیفیت ادراکی و بیشینه کیفیت مقایسه میشود که به پیدایش 7 دستة گوناگون منجر میشود. اگر کیفیت لحظهای تکهصحبت فعلی از کیفیت ادراکی کمتر باشد، وضعیت این تکهصحبت با تکهصحبت قبلی و تکهصحبت قبلتر مقایسه میشود و با توجه به شرایط پیشآمدة 1 تا 4، تغییری مناسب از سمت فرستنده اعمال خواهد شد. شرایط 1 تا 4 در شکل (1) نشان داده شدهاند. الگوریتم ارائهشده در [4] کیفیت لحظهای را تنها در یک سطح بررسی میکند که به پیدایش شرایطی دوگانه منجر میشود و 4 دستة مختلف ایجاد میکند. بالاتربودن کیفیت لحظهای تکهصحبت از کیفیت ادراکی، ما را از داشتن صدای ادراکپذیر مطمئن میکند؛ اما اینکه چقدر کیفیت پذیرفتنی است و بهازای داشتن چنین کیفیت پذیرفتنی چه میزان از پهنای باند استفاده میشود، از مقایسه با بیشینة کیفیت ممکن نتیجه میشود. اگر > QT QI، آنگاه چالش اصلی ایجاد مصالحهای بین کیفیت مطلوب و کاهش پهنای باند مصرفی خواهد بود ولی اگر < QT QI، آنگاه تلاش خواهیم کرد کیفیت صدا را افزایش دهیم. همچنین هنگامیکه > QT QI، اقدامی که صورت میپذیرد، تعیین آستانه است که مستلزم رعایت نکاتی است. برای مثال، اگر تأخیر مربوط به شبکه را 150 میلیثانیه و تأخیر ناشی از اندازة ژیتر بافر را 80 میلیثانیه در نظر بگیریم، آنگاه کاهش کیفیت برابر 0.3-0.4 MOS خواهد بود؛ درصورتیکه اگر از 30 بسته موجود در تکهصحبت، تنها سه بسته از دست برود، کاهش کیفیت لحظهای تکهصحبت برابر 0.9 MOS خواهد بود و در هنگام ازدستدادن پنج بسته، میزان این کاهش برای کدک G.711 برابر 1.75 MOS خواهد بود [11]. اگر اختلاف بین QMAX و QI کمتر از 9/0 در مقیاس MOS باشد، میزان تلفات بسته منطقی خواهد بود. در این قسمت برای کسب اطمینان بیشتر از صحت نتایج بهدستآمده آستانة بالا را برابر 7/0 در نظر میگیریم. همچنین تغییر کیفیتی برابر 0.2-0.25 MOS خیلی چشمگیر نیست و فقط برای بعضی از افراد شایان توجه است [13]؛ ازاینرو، آستانه پایین را برابر 0.2 MOS در نظر میگیریم. به این معنی که افت کیفیت تا 0.2 MOS نسبت به کیفیت بیشینه شایان توجه نیست و در زمرة کیفیتهای خیلی خوب صدا قرار میگیرد. تکهصحبتهایی که کیفیت آنها بین این دو آستانه قرار میگیرند، از کیفیتهای مطلوب با میزان تلفات بسته پایین برخوردارند؛ ازاینرو، هر وقت با چنین شرطی مواجه شویم، تنظیمات را ثابت نگه میداریم. علاوه بر موارد ذکرشده در الگوریتم، مجموعهای از N تکهصحبت متوالی را در بستههایی قرار میدهیم و برای هر تکهصحبت موجود
جدول (1) دستههای ایجادشده از مقایسة کیفیتهای لحظهای، ادراکی و بیشینه
Conditions |
||||||
1 |
2 |
3 |
4 |
5 |
6 |
7 |
|
||
شکل (1): دستههای 1 تا 4 در بررسی کیفیت تکهصحبت |
در این بستهها ارزشی معادل یک بیت در نظر میگیریم که حاصل آن بهدستآمدن بردارهای N بیتی است. همانطور که اشاره شد با مقایسة کیفیتهای لحظهای، ادراکی و بیشینه، 7 دسته ایجاد میشود. در اینجا با توجه به محدودیتهای سختافزاری، تنها 3 دسته از 7 دسته بررسی میشود.
اگر تکهصحبت دریافتی در دستة اول قرار گرفت، افزایش سطح کیفیت لحظهای به بیش از سطح کیفیت ادراکی، رضایتبخش خواهد بود؛ در غیر اینصورت تصمیم اتخاذشده کارآیی لازم را ندارد و ازاینپس، اگر تکهصحبت در این حالت قرار گرفت، باید تصمیم انتخابی را تغییر داد. جدول (2).
جدول (3) نشان میدهد که اگر تکهصحبت دریافتی در دستة پنجم قرار گرفت، تصمیمات اتخاذشده زمانی پذیرفتنی است که کیفیت تکهصحبت بعدی به یکی از دو حالت 6 و 7 ارتقا یابد؛ در غیر اینصورت عملکرد تصمیم اتخاذشده پذیرفتنی نیست و ازاینپس، اگر تکهصحبت در این حالت قرار گرفت، باید نوع تصمیم انتخابی را تغییر داد. همچنین اگر تکهصحبت در دسته 5 باقی بماند، شرایط تغییر نکرده است؛ ولی برای الگوریتم عملکردی پذیرفتنی محسوب میشود.
اگر تکهصحبت دریافتی در دستة هفتم قرار گرفت، تصمیمات اتخاذشده زمانی پذیرفتنی است که کیفیت تکهصحبت بعدی در دستة 6 قرار بگیرد. همچنین اگر تکهصحبت بعدی در حالتهای 5 و 7 قرار گرفت، تصمیمات انتخابشده برای الگوریتم نامناسب نخواهد بود. جدول (4).
|
جدول (2): تغییر از دسته 1 به دستههای 7 گانه
جدول (3): تغییر از دسته 5 به دستههای 7 گانه
|
|
جدول (4): تغییر از دسته 7 به دستههای 7 گانه
در ابتدا و با توجه به دستههای ایجادشده، تصمیمی برای ایجاد تغییرات اتخاذ میشود. برای مثال، تکهصحبت دهم در شبکه و با شرایط مشخص آن از فرستنده به سمت گیرنده حرکت میکند. برای این تکهصحبت، کدک G.711 استفاده میشود. این تکهصحبت به گیرنده میرسد و کیفیت آن با استفاده از روش E-Model به دست میآید. کیفیت بهدستآمده با کیفیت ادراکی مقایسه میشود. اگر کیفیت تکهصحبت کمتر از کیفیت ادراکی باشد، مقدار ‘0’ و در غیر این صورت مقداری معادل با ‘1’ را میپذیرد. اگر این مقدار ‘1’ باشد، تنظیمات سمت فرستنده مناسب است و این تنظیمات بدون تغییر باقی میماند؛ اما اگر این مقدار ‘0’ بود، الگوریتم درمییابد که تنظیمات مربوط باید تغییر کند؛ لذا الگوریتم اقدامی را انتخاب میکند؛ مثلاً طول بسته را زیاد میکند و نرخ بیت را کاهش میدهد. دستور اجرای این تغییرات از سمت گیرنده به فرستنده ارسال میشود و تکهصحبت بعدی ارسالی از سمت فرستنده متأثر از این تغییرات خواهد بود؛ یعنی کدک استفادهشده برای تکهصحبت یازدهم - به شرط آنکه RTT کمتر از طول تکهصحبت (در اینجا 300 میلیثانیه) باشد - G.726 است و طول بستة این تکهصحبت نسبت به تکهصحبت دهم بیشتر خواهد بود. پس از انتقال N تکهصحبت متوالی در بستر شبکه، برداری N بیتی در اختیار داریم که هر بیت نشاندهندة کمتر یا بیشتربودن کیفیت لحظهای تکهصحبت در مقایسه با کیفیت ادراکی است. چون کیفیت تکهصحبتهای پایانی اهمیت بیشتری دارند و ماندگاری بیشتری در حافظة شنونده دارند، ترتیب بیتهای موجود در بردار N بیتی معکوس میشود تا تأثیرگذاری تکهصحبتهای پایانی بیشتر مشخص شود. مثلاً اگر برداری 5 بیتی بهصورت «10110» باشد، تکهصحبتهای اول، سوم و چهارم از کیفیت بیشتر و تکهصحبتهای دوم و پنجم کیفیت پایینتری نسبت به کیفیت ادراکی دارند؛ ازاینرو، ترتیب بیتی معکوس میشود. برای مثال، در حالت فوق ترتیب بیتی به «01101» تغییر میکند تا ارزش بیتی تکهصحبت پنجم بیش از تکهصحبت چهارم و سوم باشد. در ادامه، الگوریتم درمییابد که تغییر تنظیمات ایجادشده بر تکهصحبت دوم ناموفق بوده است؛ زیرا مقداری برابر ‘0’ دارد؛ بنابراین هرگاه شرایطی مشابه با شرایط رخداده بر تکهصحبت دوم اتفاق افتد، الگوریتم از تنظیمات جدیدی استفاده میکند تا تنظیمات حاصل کیفیت را بهبود دهد. تغییر تنظیمات ایجادشده بر تکهصحبت سوم موفق است؛ زیرا مقداری برابر ‘1’ دارد؛ بنابراین هرگاه شرایط مشابهی رخ دهد، الگوریتم از همان تنظیمات استفاده میکند. شکل (2) روند دستیابی الگوریتم به بستههای N بیتی را مشخص میکند. با عبور N تکهصحبت متوالی بعدی از بستر شبکه، بستة N بیتی بعدی نیز تولید شده است که مراحل ذکرشدة بستة قبل برای این بسته نیز طی خواهد شد. با داشتن مقادیر صحیح این دو بستة باینری، روند تأثیرگذاری دستورات انتخابی در بستة N بیتی دوم در مقایسه با بستة N بیتی اول ارزیابی میشود. شکل (3) نشاندهندة دو بستة 5 بیتی متوالی است. با ارائة این الگوریتم هر تکهصحبت نسبت به تکهصحبت قبلی خود باید تا حد امکان کیفیت بهتری داشته باشد. همین وضعیت نیز برای بستههای N بیتی تکهصحبت برقرار است و کیفیت بستة N بیتی n ام باید تا حد امکان بیش از کیفیت بستة N بیتی (n-1) ام باشد. ممکن است در پارهای از اوقات این شرایط برقرار نباشد؛ ولی درمجموع باید کیفیت تکهصحبتها بهصورت تکی و گروهی در حال افزایش است و یا دستکم کاهش نمییابد؛ بنابراین هرچه به انتهای مکالمه نزدیک میشویم، کیفیت صدای دریافتی در سمت گیرنده افزایش مییابد و باعث افزایش رضایتمندی کاربران خواهد شد. شکل (4) عملکرد الگوریتم را از چند منظر بررسی میکند.
|
شکل (2): عملکرد الگوریتم در بهدستآوردن بستههای N بیتی
شکل (4) از هفت سطر تشکیل شده است که ما را در فهم بهتر عملکرد الگوریتم یاری میکند. سطر اول،شمارة تکهصحبتهای اول تا چهلم است. سطر دوم دستهای را نمایش میدهد که تکهصحبت در آن قرار میگیرد. سطر سوم تصمیم اتخاذشده برای اعمال بر تکهصحبت بعدی است که بهاختصار نشان داده شده است. سطر چهارم، مشخصکنندة سطح کیفیت لحظهای تکهصحبت در مقایسه با سطح کیفیت ادراکی است.
|
شکل (3): دو بسته 5 بیتی متوالی
سطر پنجم تنظیمات جدیدی است که بر روی تکهصحبت بعدی اعمال خواهد شد. عدد بالایی نشاندهندة طول بسته بر اساس میلیثانیه و عدد پایینی نشاندهندة نرخ بیت بر اساس Kbps است. سطر ششممعادل بیتی کیفیت لحظهای N تکهصحبت در مقایسه با کیفیت ادراکی است و سطرهفتم مقایسة صعودی یا نزولیبودن کیفیت N تکهصحبت فعلی با N تکهصحبت پیشین را انجام میدهد. شکل (4)، وضعیت تکهصحبتهای 1 تا 40 و تصمیمات اتخاذشده برای بهبود کیفیت را در هریک از تکهصحبتها نشان میدهد. تکهصحبت اول، درصورت رسیدن به گیرنده و بررسیشدن کیفیت آن در دستة 2 قرار میگیرد. همانطور که گفته شد به دلیل محدودیتهای سختافزاری، الگوریتم، تصمیمات متفاوتی برای دستههای 1، 5 و 7 میگیرد و به هنگام قرارگرفتن تکهصحبت در سایر دستهها، تنظیمات بدون تغییر باقی میماند؛ ازاینرو، به علت قرارگرفتن تکهصحبت اول در دستة 2، تنظیمات تغییر نمیکند و شرایط موجود در شبکه، ممکن است اوضاع
شکل (4): بررسی عملکرد الگوریتم بر روی تکهصحبتهای اول تا چهلم
را بهبود دهد. تکهصحبت دوم نیز در دستة 2 قرار میگیرد و تنظیمات تغییری نمیکند؛ گفتنی است اگر یک حالت (که تنظیمات آن تغییر نمیکند) بیش از چهار بار پیاپی تکرار شود، الگوریتم بهجای ثابت نگهداشتن تنظیمات، برای یکبار نرخ بیت را افزایش میدهد. تکهصحبت سوم در دستة 3 قرار میگیرد و همچنان تنظیمات را تغییر نمیدهیم. تغییرندادن تنظیمات در این حالت نیز موجب قرارگرفتن تکهصحبت چهارم در دستة 1 میشود. در این حالت و وضعیت بسیار بد، الگوریتم، یکی از تصمیمات چهارگانه را بهصورت اتفاقی انتخاب میکند. در اینجا تصمیم اتخاذشده کاهش نرخ بیت است. با ایجاد این تغییر، انتظار میرود تکهصحبت پنجم کیفیتی بهتر داشته باشد و کیفیت لحظهای این تکهصحبت بالاتر از کیفیت ادراکی قرار بگیرد. هنگامیکه تکهصحبت پنجم به گیرنده میرسد و کیفیت لحظهای آن ارزیابی میشود، این کیفیت در دستة 3 واقع میشود. بدین معنی که کاهش نرخ بیت به بهبود کیفیت کمکی نکرده است؛ بنابراین چون کاهش نرخ بیت، حالت 1 را به یکی از حالتهای 5، 6 و 7 ارتقا دهد، اگر تکهصحبت مجدداً در حالت 1 قرار بگیرد، دیگر کاهش نرخ بیت انتخاب نمیشود و تصمیم دیگری گرفته میشود. همانطور که شکل (4) نشان میدهد، کیفیت لحظهای 5 تکهصحبت اول از کیفیت ادراکی پایینتر است و ارزش بیتی معادل‘0’ دارند. ازاینرو، بستة N بیتی اول، ارزشی معادل "00000" دارد. ارزیابی کیفیت لحظهای تکهصحبت هفتم مشخص میکند که این تکهصحبت در دستة 1 قرار گرفته است. در این حالت، الگوریتم از میان تصمیمات چهارگانه، 3 انتخاب دارد؛ زیرا کاهش نرخ بیت (که قبلاً استفاده شده است) کیفیت را افزایش نداده است. تصمیم انتخابشده افزایش طول بسته است. این افزایش طول بسته باعث میشود که تکهصحبت بعدی در دستة 5 قرار بگیرد؛ بنابراین افزایش طول بسته نتیجهای مطلوب به همراه داشته است و مجدداً اگر تکهصحبت در دستة 1 قرار بگیرد، تصمیم انتخابشونده افزایش طول بسته است. تکهصحبت شانزدهم نیز در دستة 1 قرار میگیرد و چون دفعة قبل افزایش طول بسته در بهبود کیفیت تأثیر مثبت داشت، این بار نیز طول بسته افزایش مییابد. افزایش طول بسته به بهبود کیفیت تکهصحبت بعدی کمکی نمیکنند؛ بنابرای دفعة بعد که کیفیت تکهصحبت در دستة 1 قرار بگیرد، دیگر از تصمیم افزایش طول بسته استفاده نمیشود. تکهصحبت هجدهم نیز در دستة 1 قرار میگیرد و الگوریتم برای انتخاب تصمیم مناسب با دو گزینه مواجه است؛ زیرا کاهش نرخ بیت و افزایش طول بسته انتخاب نمیشوند. تصمیم انتخابشوندة الگوریتم، کاهش طول بسته است که با موفقیت همراه است. تکهصحبت بیست و پنجم نیز در دستة 1 قرار میگیرد که با توجه به موفقیتآمیزبودن کاهش طول بسته، این بار نیز طول بسته کاهش مییابد و باز هم این تغییر موفقیتآمیز است؛ بنابراین دفعة بعد نیز که تکهصحبت در دستة 1 قرار گرفت، تصمیمی که الگوریتم باید انتخاب کند کاهش طول بسته خواهد بود. تکهصحبت سی و یکم نیز در دستة 1 قرار میگیرد و الگوریتم میباید طول بسته را کاهش دهد؛ اما این اتفاق رخ نمیدهد و طول بسته افزایش مییابد. به علت اینکه طول بسته 10 میلیثانیه است و این مقدار کمترین مقدار ممکن در این الگوریتم است، کاهش طول بسته امکانپذیر نیست. الگوریتم سراغ تصمیم چهارم میرود و آن افزایش نرخ بیت است و چون نرخ بیت فعلی نیز در بیشترین حد ممکن است، الگوریتم نرخ بیت را افزایش نمیدهد؛ بنابراین از میان کاهش نرخ بیت و افزایش طول بسته باید یک تصمیم انتخاب شود. به علت اینکه در حالتهای مشابه، عملکرد افزایش طول بسته بهتر از کاهش نرخ بیت بوده است، الگوریتم، افزایش طول بسته را انتخاب میکند. اگر تکهصحبت در دستههای 5 و 7 قرار بگیرد، الگوریتم همین روند را طی خواهد کرد. گفتنی است در 40 تکهصحبتِ اول هرگاه تکهصحبت در دستههای 1، 5 و 7 قرار بگیرد، الگوریتم از تصمیم ثابت نگهداشتن تنظیمات (Keep Setting) استفاده نمیکند؛ اما برای تکهصحبتهای چهلم به بعد این تصمیم ممکن است بهفراخور با الگوریتم انتخاب شود. بعد از 40 تکهصحبت، 8 بستة 5 بیتی وجود دارد (در اینجا N برابر است با 5) که میزان بهبود کیفیت در هر مجموعه تکهصحبت نسبت به مجموعة قبلی ارزیابی میشود. سطر هفتم شکل (4) نشاندهندة صعودی یا نزولیبودن کیفیت مجموعة N تکهصحبت است. هرگاه 3 مجموعة N بیتی متوالی روندی نزولی داشته باشند و مقدار حداقل یکی از این 3 مجموعه کمتر از 10 برای تکهصحبتهای اول تا چهلم و کمتر از 20 برای تکهصحبتهای 40 به بعد باشد، الگوریتم در مجموعة N بیتی بعدی رفتاری متفاوت خواهد داشت؛ بدین ترتیب که الگوریتم بدون توجه به اتفاقات پیشآمده نرخ بیت را در حداکثر مقدار ممکن قرار میدهد و هرگاه کیفیت تکهصحبت در دستههای 2، 3 و 4 قرار گرفت، بهجای ثابت نگهداشتن شرایط، نرخ بیت را افزایش میدهد. این تغییر رفتار الگوریتم تنها در یک مجموعه تکهصحبت رخ میدهد تا روند نزولی کیفیت را کاهش دهد. پس از 40 تکهصحبت عملکرد الگوریتم کمی تغییر میکند. ازاینپس هرگاه تکهصحبت در دستههای 1، 5 و 7 قرار بگیرد، تصمیمگیری الگوریتم بر اساس عملکرد تصمیمات در 40 تکهصحبت اول است. جدول (5) نشان میدهد که از 40 تکهصحبت ابتدایی، 6 تکهصحبت در دستة 1 قرار گرفته است و الگوریتم برای بهبود وضعیت، سه بار تصمیم گرفته است طول بسته را افزایش دهد که دو بار با موفقیت همراه بوده است. همچنین الگوریتم دو بار تصمیم گرفته است طول بسته را کاهش دهد و هر دو بار کیفیت تکهصحبت بهبود یافته است. الگوریتم یکبار نیز نرخ بیت را کاهش
|
جدول (5): عملکرد تصمیمات اتخاذشده در دستههای 1، 5 و 7 در چهل تکهصحبت ابتدایی
داده که در بهبود وضعیت ناموفق بوده است. این موارد معیار تصمیمگیری الگوریتم برای تکهصحبتهای 40 به بعد است؛ بهطوریکه هرگاه کیفیت تکهصحبت در حالت 1 قرار بگیرد، اولین تصمیم، کاهش طول بسته است. دومین تصمیم، افزایش طول بسته خواهد بود. طبق موارد ذکرشده، برای تکهصحبتهای چهلم به بعد، الگوریتم به هنگام قرار گرفتن تکهصحبت در حالت 5، ابتدا نرخ بیت را افزایش و سپس طول بسته را کاهش میدهد. همچنین الگوریتم به هنگام قرار گرفتن تکهصحبت در حالت 7، کاهش نرخ بیت را انتخاب میکند که بهترین تصمیم است. در الگوریتم ارائهشده در [4] فرآیندهای مربوط به 40 تکهصحبت ابتدایی وجود ندارد.
برای پیادهسازی الگوریتم، ابتدا در محیط MATLAB شبکهای را شبیهسازی میکنیم که شامل ترافیک از نوع داده[16] و صدا[17] است. شکل (5) توپولوژی شبکه مدّنظر را نشان میدهد. این شبکه شامل 20 تماس با رفتار یکسان در سمت گیرنده است که موجب تولید ترافیک صدا در شبکه VoIP میشود. مدتزمان هر تماس 30 ثانیه است که به 100 تکهصحبت[18] با طول یکسان تبدیل میشود. 10 منبع داده نیز ترافیک on/off Pareto را با پارامتر ضمیمه 2a < در شبکه VoIP تولید میکند؛ بهطوریکه در طول مدت on، نرخ ترافیک مقدار ثابتی است. در این شبکه اندازه بستههای داده[19] سه مقدار متفاوت 40 بایت، 550 بایت و 1500 بایت است و از 3 کدک[20] متفاوت G.711، G.726 و G.729 استفاده میشود. عملکرد این 3 نوع کدک بر بهبود و یا کاهش کیفیت صدا تأثیرگذار است. با توجه به [14] و [15] و [16]، ویژگیهای هریک از این سه نوع کدک برای بستهای به طول 10 میلیثانیه در جدول (6) مشاهده میشود. گفتنی است پارامترهای کدک گفتار همچون طول بسته، فشردهسازی و محدوده فرکانسی سیگنال، همگی متغیر هستند. کدکها نیز از الگوریتم PLC[21] داخلی استفاده میکنند که عملکرد این الگوریتم با ضریب Bpl در E-Model تعریف میشود. لینکهای استفادهشده در این شبیهسازی 5 مگابیت بر ثانیه هستند و شبکه در یک مکان دچار ازدحام میشود. روتر گلوگاه[22] از صفبندی FIFO و سازوکار دور انداختن[23] در هنگام سرریز استفاده میکند و اندازة صف بهکاررفته در روتر 64 کیلوبایت است. همانطور که در [17] و [18] پیشنهاد شده است ترافیک داده، توزیع Pareto دارد که شاخص آن برابر 5/1 است. چنین ترافیکی رفتاری مشابه با رفتار ترافیک در اینترنت خواهد داشت. بهطورمعمول طول بسته در ترافیک اینترنت حول 3 مقدار تمرکز دارد. حدود 60 درصد بستهها 40 بایت، 25 درصد بستهها 550 بایت و 15 درصد بستهها 1500 بایت دارند [19].
|
شکل (5): معماری شبکه VoIP
جدول (6): پارامترهای کدک گفتار به ازای بستة به طول 10 میلیثانیه
G.729 |
G.726 |
G.711 |
Codec |
8:1 |
2:1 |
1:1 |
Compression Ratio |
40 |
64 |
96 |
Total Bitrate (Kbps) |
11 |
7 |
0 |
Equipment Impairment (Ie) |
19 |
23 |
25 |
Packet Loss Robustness (Bpl) |
3.9 |
4.1 |
4.3 |
Maximum MOS |
نتایج شبیهسازی
با توجه به مقایسههای صورت گرفته بین کیفیتهای لحظهای و کیفیت ادراکی و مطابق با جدول (1) با هفت دستة گوناگون روبهرو هستیم و باید مشخص کرد که اگر تکهصحبت ارسالی در هریک از این دستهها قرار گرفت، چه تصمیمی از طرف فرستنده اتخاذ شود. حال باید ارزیابی کرد در هر یک از دستههای 7 گانه، کدامیک از تصمیمات بهترین تأثیر را بر کیفیت صدای انتقالی در بستر شبکه دارد.
به علت اینکه هیچیک از پارامترهای ذکرشده مستقل نیست و تغییر آنها بر عوامل دیگر نیز تأثیر میگذارد، توصیف تأثیر تغییر هریک از پارامترها بهصورت نظری دشوار است؛ بنابراین سعی شده است با شبیهسازی تأثیر این تغییرات بررسی شود. درخور ذکر است الگوریتم پیشنهادی تأثیرگذاری 73 درصدی دارد. به این معنا که از میان تعداد دفعاتی که الگوریتم پیشنهادی شبیهسازی شد، نزدیک به 73 درصد از شبیهسازیها هدف مدّنظر از طراحی الگوریتم را محقق ساخت. پس از بررسی تمام شبیهسازیهای موفقیتآمیز به این نتیجه میرسیم که بهترین تصمیم در هر یک از دستههای پیشآمده چیست. نتایج بهدستآمده در محیط MATLAB برای هریک از دستههای 3 گانه در ادامه بررسی شده است.
در دستة 1، کیفیت بههیچوجه مطلوب نبوده است و هدف از انتخاب تصمیمهای گوناگون بهبود کیفیت است و اگرچه کاهش منابع مصرفی اهمیت دارد؛ ولی اولویتی ندارد.
در این حالت، تأثیر تغییر طول بسته بیش از تغییر نرخ بیت است. درواقع، برای رسیدن به کیفیت مطلوب در این حالت تغییر طول بسته نسبت به تغییر نرخ بیت بیش از 2 برابر تأثیرگذارتر است. همانطور که شکل (6) نشان میدهد هنگامیکه تکهصحبت در این دسته قرار میگیرد، کاهش طول بسته تأثیر بیشتری نسبت به سایر تصمیمات در بهبود کیفیت دارد. پس از آن، افزایش طول بسته نیز تأثیر بهسزایی در بهبود کیفیت دارد و میزان تأثیرگذاری افزایش طول بسته اختلاف چندانی با کاهش آن ندارد؛ ولی اندکی کمتر است. در مقایسة افزایش و کاهش نرخ بیت، افزایش نرخ بیت تأثیر چشمگیرتری نسبت به کاهش نرخ بیت دارد؛ درنتیجه کاهش نرخ بیت تأثیر صفر درصدی دارد. اولویت در این حالت، بهبود کیفیت است و با توجه به شرایط تکهصحبت، کاهش پهنای باند مصرفی، کیفیت را بهبود نمیدهد؛ بنابراین اولویت ندارد. به همین دلیل است که کاهش نرخ بیت تأثیر بسیار کمی در بهبود کیفیت دارد. بهطورکلی، هنگامیکه کیفیت تکهصحبت در دسته 1 قرار میگیرد، برای رسیدن به کیفیت مطلوب، بهتر است ابتدا طول بسته کاهش یابد و هرگز از کاهش نرخ بیت استفاده نشود.
در دستة 5، کیفیت لحظهای از کیفیت ادراکی بیشتر است و اختلاف کیفیت بیشینه و کیفیت لحظهای بیش از 7/0 است. در این دسته، کیفیت نسبتاً مطلوب است؛ ولی بر اثر تلفات بسته ممکن است این کیفیت کاهش یابد؛ بنابراین، سعی میشود اثرات تلفات بسته از بین برود. همانطور که شکل (7) نشان میدهد، در این شرط بیشترین تأثیرگذاری از آن افزایش طول بسته است. تأثیر افزایش طول بسته 40 درصد و تأثیر افزایش نرخ بیت حدود 31 درصد است. کاهش نرخ بیت و کاهش طول بسته نیز تأثیرگذاری بهمراتب کمتری دارند. اگرچه افزایش طول بسته تأخیر انتها به انتها را افزایش میدهد، باعث کاهش ازدحام در شبکه میشود که کاهش تلفات بسته را به دنبال دارد.
در این دسته، کیفیت لحظهای از کیفیت ادراکی بیشتر است و کیفیت لحظهای نیز به کیفیت بیشینه نزدیک است. در این حالت، کیفیت مطلوب حاصل شده است و دغدغة اصلی در این بخش کاهش منابع مصرفی با حفظ کیفیت مطلوب است. وقتیکه تکهصحبت در این حالت قرار میگیرد، تغییرات نرخ بیت خیلی بیش از تغییرات طول بسته، تأثیرگذار است. تأثیرگذاری تغییر نرخ بیت، 13 برابر بیشتر از تأثیرگذاری تغییر طول بسته است. همانطور که شکل (8) نشان میدهد، تأثیرگذارترین پارامتر در این بخش کاهش نرخ بیت است. ملاحظه میشود که تأثیرگذاری کاهش نرخ بیت حدود 90 درصد است. درواقع، با کاهش نرخ بیت، هم کیفیت مطلوب حفظ شده است و هم پهنای باند مصرفی کاهش یافته است. تغییر طول بسته نیز تأثیر اندکی در حفظ کیفیت و کاهش پهنای باند مصرفی داشته است که در مقایسه با کاهش نرخ بیت شایستة صرفنظرکردن است.
|
|
|
||||||
شکل (6): مقایسه تأثیرگذاری تصمیمات مختلف در دسته 1 |
شکل (7): مقایسه تأثیرگذاری تصمیمات مختلف در دسته 5 |
شکل (8): مقایسه تأثیرگذاری تصمیمات مختلف در دسته 7 |
|
شکل (9): اولویت تصمیمگیریدر دستههای 1، 5 و 7
برای کارهای بیشتر، مدت زمان مکالمه و طول تکهصحبتها، متغیر درنظر گرفته میشود و کیفیت صدا ارزیابی میشود و بهترین تصمیم در هریک از دستههای 7گانه بررسی میشود. بررسی تأثیر تصمیمات بر آواهای زبان فارسی، بررسی تأثیر اولویتدهی به مشترکان در نتایج بهدستآمده، یافتن روابط مستقیم و معکوس میان کیفیت سرویس و کیفیت تجربه و بررسی ریاضی بهترین حالتهای کیفیت سرویس و کیفیت تجربه با تغییر پارامترها از دیگر کارهایی است که در آینده انجامپذیر خواهد بود.
[1]تاریخ ارسال مقاله: 19/10/1394
تاریخ پذیرش مقاله: 21/10/1395
نام نویسندة مسئول: احسان فقیهی
نشانی نویسندة مسئول: ایران - تهران - بزرگراه نیایش - دانشگاه صداوسیما - دانشکدة فنی و مهندسی رسانه
[1] Circuit-Switched Network
[2] Packet-Switched Network
[3] Voice Over IP
[4] Zdenek Becvar
[5] Harmonic
[6] Sub-Band
[7] Objective
[8] Lukas Novak
[9] Subjective
[10] Frame
[11] Richard A. Thompson
[12] End-to-End Delay
[13] Quality of Experience
[14] Muhammad Aamir
[15] Mean Opinion Score
[16] Data Traffic
[17] Voice Traffic
[18] TalkSpurt
[19] Data Packet Size
[20] Codec
[21] Packet Loss Concealment
[22] Bottleneck Router
[23] Drop Tail