مطالعه پردازش سیگنال ( اسپکتروگرام) و کاربرد های آن و چگونگی رسم آن در متلب

فهرست

 

1 مقدمه.............................................................................................................................................................3

2 اسپکتروگرام...................................................................................................................................................3

3 اسپکتروگرام باند محدود و گسترده(Narrowband and Wideband spectrogram.................................4

3-1        اسپکتروگرام باند وسیع( Wideband spectrogram)....................................................................6

3-2 اسپکتروگرام باند محدود ( Narrowband spectrogram)...............................................................6

4  پردازش سیگنال های صوتی در متلب.........................................................................................................7

4-1 رسم سیگنال های صوتی در متلب..........................................................................................................7

4-2 رسم سيگنال نمونه برداري شده............................................................................................................8

4-3 رسم اسپکتروگرام(Spectrogram) در متلب ...............................................................9

4-4 نمودار اسپکتروگرام سیگنال صوتی بعد از گذر از فیلتر شکاف ( notch filter)....................................9

4-4-1 فیلترهای الکترونیکی.........................................................................................................................11

4-4-1-1 طراحي notch filter............................................................................12

4-4-1-2 سیگنال صوتی پس از عبور از فیلتر.............................................................................................13

4-4-1-3  اسپکتروگرام بعد از عبور از اعمال فیلتر......................................................................................14

5 نتیجه گیری...............................................................................................................................................15

6 مراجع   ....................................................................................................................................................16

 

1-                     مقدمه

هدف بلند مدت سیستم‌های بازشناسی خودکار گفتار، طراحی ماشینی است که سیگنال صوتی مربوط به یک جملهٔ بیان شده را به دنباله‌ای از کلمات نوشته شده تبدیل نماید. سیستم‌های بازشناسی خودکار گفتار اطلاعات متنوعی ازمنابع دانش گوناگون را در جهت دستیابی به جملهٔ بیان شده از روی سیگنال صوتی دریافت شده‚به کار می‌گیرند. پردازش گفتار به عنوان یکی از زیر شاخه‌های پردازش سیگنال ، به سرعت در حال گسترش است. تکنیک‌های پیچیده و نواوری‌های روز افزون این دانش٫همگی در راستای دستیابی به این آرزو هستند که امکان بیابیم مفاهیم در قالب ابزارهای ریاضی فراهم گردد. در اینجا، به بیان خلاصه‌ای از انواع روش‌های پردازش گفتار می‌پردازیم:

۱-تحت تاثیر قرار گرفتن کیفیت سیگنال صوتی به وسیلهٔ نویز محیط و تابع انتقال سیستم انتقال مانند میکروفن‚تلفن

۲-عدم وضوح مرز ما بین کلمات و واج‌ها در سیگنال صوتی

۳-تنوع وسیع سرعت بیان

۴-دقت ناکافی در بیان کلمات و به خصوص انتهای انها در گفتار محاوره‌ای نسبت به گفتار مجزا.

۵-تاثیر تنوعات متعدد گوینده از جمله جنسیت‚شرایط فیزیولوژیک و روانی بر گفتار.

۶-به کارگیری محدودیت‌های معنایی-نهوی زبان برای گفتار زبان طبیعی به روشی مشابه ارتباط انسان با انسان در سیستم بازشناسی.

2-                     اسپکتروگرام

سیگنال گفتاری به دو صورت بازنمایی می شود:

1) بازنمایی در واحد زمان که همان شکل موج است. در این بازنمایی ما می توانیم خود شکل موج، دوره تناوب آن، پریودیک یا غیرپریودیک بودن شکل موج و آشفتگی ها را مشاهده کنیم.

 2) بازنمایی در واحد فرکانس: این نوع بازنمایی همان کاری است که اسپکتروگرافی انجام می دهد و یک تصویر سه بعدی برای ما فراهم می کند. در این نوع بازنمایی ما هم فرمنت ها و هم هارمونیک ها را می توانیم بخوبی مشاهده کنیم.

طیف نگار برای ما یک طیف نگاشت ایجاد می کند که یک نمایش گرافیکی از انرژی اجزا فرکانسی سیگنال گفتاری است

رایجترین فرمت اسپکترگرام دو بعدی است که محور x  ها زمان و محور y ها فرکانس است البته فرمت سه بعدی هم وجود دارد که بعد سوم یعنی محور z  ها به عنوان دامنه انرژی می باشد.

انرژی معمولا با خطوط عمودی تیره نمایش داده می شود که هرچه تیره تر باشد، به معنای وجود انرژی بیشتر می باشد.

اسپکتروگرافی بر پایه تئوری Fourier  می باشد که می گوید همه امواج پریودیک قابلیت تجزیه شدن به امواج سینوسی با دامنه های متفاوت می باشند که فرکانس های آنها با یکدیگر نسبت صحیحی دارند.  Fourier analysis فرایندی است که یک موج پیچیده را به موج های سینوسی ساده تبدیل می کند.

اسپکتروگرام معمولا به دو راه ساخته می شود :

1-   تقریب به عنوان یک بانک فیلتر که نتایج حاصل از یک سری فیلتر پایین گذر است(این تنها راه قبل از ظهور پردازش سیگنال به صورت مدرن بود)

2-   سیگنال زمان با استفاده از تبدیل فوریه زمان کوتاه (stft) محاسبه می شود

این دو روش در واقع دو فرم متفاوت درجه دوم توزیع زمان- فرکانس است اسپکتروگرام یک سیگنال (به عنوان مثال s(t)) با محاسبه ی دامنه ی stft  به توان دو قابل تخمین است :                   

Spectrogram(t,w)=         

در اوایل اسپکتروگرام آنالوگ به عنوان طیف گسترده در اکثر زمینه ها از جمله مطالعه ی پرندگان به کار گرفته شد شکل زیر اسپکتروگرام یک دولفین را نشان می دهد :

 

 

همچنین شکل زیر اسپکتروگرام واژه ی compute  است

 

محور عمودی نشان دهنده فرکانس تا 8000 هرتز است و محور افقی زمان را نشان می دهد و رنگ ها نشان دهنده ی بیشترین پیک های صوتی در چارچوب زمان است ، رنگ قرمز نشان دهنده ی بالاترین انرژی و پس از آن به ترتیب: نارنجی،زرد، سبز، فیروزهای، آبی و بنفش و خاکستری می باشند و بخش سفید در زیر یک سطح آستانه دسیبل است.

 

 

3-                        اسپکتروگرام باند محدود و گسترده(Narrowband and Wideband spectrogram) :

 

همانطور که می دانید رابطه بین زمان و فرکانس عکس است و در حالیکه F=1/t عکس آن  t=1/F نیز صحیح می باشد. اسپکتروگرام ممکن است اطلاعاتی در مورد ساختارهای هارمونیکی منبع سیگنال و یا اطلاعاتی در مورد ویژگی های تشدیدی مجرای صوتی بدهد. هر دوی این مجموعه از اطلاعات، نمی توانند به طور همزمان نمایش داده شوند، چونکه همانطور که ذکر شد زمان و فرکانس عکس هم هستند.

زمانیکه اطلاعات فرکانسی و یا زمانی نمایش داده می شوند، این جزئیات بهfrequency resolution(شفافیت فرکانسی) و یا  time resolution( شفافیت زمانی) ارجاع داده می­شود. Resolution  به معنایFilter bandwidthتوصیف می شود. حال به توصیف انواع اسپکتروگرام می پردازیم:

 

3-1 اسپکتروگرام باند وسیع( Wideband spectrogram):

 

دارای پهناد باند زیادی است که تعدادی فرکانس را در یک زمان عبور می دهد و به همین خاطر فرکانس های خروجی از آن قابل تمایز از یکدیگر نیستند.

 

از دیگر ویژگی های آن می توان به موارد زیر اشاره کرد:

 

1- frequency resolution ضعیفی دارد

2- time resolution خوب است.

3- در آن هارمونیک ها با هم ترکیب می شوند و از یکدیگر قابل تمایز نیستند.

4- ساختار فرمنتی را به خوبی نشان می­دهد.

5- می­توان در آن پاالس های حنجره را مشاهده کرد.

 

3-2 اسپکتروگرام باند محدود ( Narrowband spectrogram)

 

دارای پهنای باند کمی می باشد و تنها یک فرکانس را در واحد زمان از آن عبور می کند، به همین خاطر در خروجی آن همه فرکانس ها  از یکدیگر قابل تمایز هستند. از دیگر ویژگی های آن می توان به موارد زیر اشاره کرد:

 

1- frequency resolutionخوبی دارد.

2- time resolutionضعیف است(زمان زیادی برای فیلتر کردن گفتار نیاز دارد).

3- در آن هارمونیک ها از یکدیگر قابل تمایز اند.

4- ساختار فرمنتی را به خوبی نشان نمی دهد.

5-   نمی توان در آن پالس های حنجره را مشاهده کرد.

 

 

4-                     پردازش سیگنال های صوتی در متلب

یک نمونه سیگنالهای صوتی که فایل آن به ضمیمه ی پروژه تحویل شما بزرگوار  قرار داده شده پس از load كردن در متلب، در حوزه زمان و حوزه فركانس پردازش مي كنيم

4-1 رسم سیگنال های صوتی در متلب

 

کد در متلب:

figure(1);plot(data);title('main wave');grid on   %mainwave

4-2 رسم سيگنال نمونه برداري شده

 

کد در متلب:

c=data(1:5000);

figure(2);plot(c);title('part of main wave');grid on

 

 4-3 رسم اسپکتروگرام(Spectrogram) در متلب

همانطور که در قسمت 3 بیان شد نمودارهای اسپکتروگرام نیز یک شکل سه بعدی برای ما به تصویر می کشند که چگالی طیف توان رادر زمان ها و فرکانس های مختلف از روی آنها می یابیم .یعنی همان منحنی توان بر حسب فرکانس است که  برای تخمین طیف توان استفاده می شود.

 

کد در متلب:

figure(3);specgram(c,512,fs);title('spectrogram');

 

4-4 نمودار اسپکتروگرام سیگنال صوتی بعد از گذر از فیلتر شکاف ( notch filter)

در ابتدا برای روشن شدن موضوع توضیحاتی اجمالی در رابطه با فیلتر های الکترونیکی و دیجیتالی بیان خواهد شد

 

4-4-1 فیلترهای الکترونیکی

مدارهاي الكترونيكي هستند كه اعمال پردازش سيگنال را انجام مي دهند، بويژه هنگامي كه مي خواهيم سيگنال هاي ناخواسته عناصر را از بين ببريم و مدارهای الکترونیکی که انجام پردازش سیگنال توابع ،یا به طور خاص برای حذف مولفه فرکانسی ناخواسته از سیگنال ها به کار می رود تا کیفیت سیگنالهایی که می خواستیم بالا برود

انواع فیلترهای الکترونیکی را میتوان به صورت زیر تقسیم کرد:

1)غیر فعال یا فعال

2)آنالوگ یا دیجیتال

3)بالا گذر یا پایین گذر

4)پاسخ ضربه نامحدود یا محدود

5)خطی یا غیر خطی

مورد استفاده ترین انواع فیلتر های الکترونیکی فیلترهای خطی هستند صرف نظر ازجنبه های دیگر آن طراحی وتجزیه تحلیل آن آسان تر است.

    فيلتر پايين گذر- فركانس هاي پايين را عبور مي دهد، فركانس هاي بالا تضعيف شده اند.
  فيلتر بالا گذر – فركانس هاي بالا را عبور مي دهد، فركانس هاي پايين تضعيف شده اند.

  فيلتر ميان گذر – فقط فركانس هايي كه در يك باند فركانسي هستند را عبور مي دهد

  فيلتر ميان نگذر – فقط فركانس هايي كه در يك باند فركانسي تضعيف شده اند.عبور می دهند

  فيلتر همه گذر – همه فركانس هايي كه عبور مي كنند، اما فاز خروجي اصلاح شده است.

از میان فیلترهای فوق تنها به بحث راجع به فیلتر میان نگذر می پردازیم . در پردازش سیگنال، یک فیلتر میان نگذر فیلتری است که اغلب فرکانسها را بدون تضعیف عبور می دهد، اما محدوده مشخصی را تضعیف می کند. فیلتر میان نگذر برگردان کلمه لاتین Band-stop FILTER است که بعضی مواقع ترجمه Band-rejection filter نیز به حساب می آید که  اغلب فرکانسها را بدون تضعیف عبور می دهد، اما محدوده مشخصی را به شدت تضعیف می کند. این فیلتر در مقابل فیلتر میان گذر Band-pass filter)) است. فیلتر شكافي (Notch filter) یک فیلتر میان نگذر با باند تضعیف بسیار نازک (Q بالا) است. فیلترهای شکافی در سیستمهای PA – مخفف public-address system به معنی مکانیزمی جهت تقویت صوت برای عموم یا ناحیه ای بزرگ است - و همچنین در وسایل تقویت کننده (مخصوصاً آمپلی فایرها و پیش آمپلی فایرهای تجهیزات صوتی نظیر گیتارهای صوتی، ماندولین، تقویت کننده های صدای بم و غیره) استفاده می شوند تا فیدبک هائی که در اثر طیف فرکانسی ایجاد می شوند را کاهش دهد یا حذف کند. سایر اسامی این فیلتر Band-limit filter و T-notch filter و Band-elimination filter وBand-rejection filter است.

4-4-1-1 طراحيnotch filter:

%NOTCH FILTER

f=250;

Q=35;

W0=(60/(f/2));

Bw=W0/Q;

[b,a]=iirnotch(W0,Bw);

fvtool(b,a); title('magnitude and phase response for notch filter')                    %magnitude and phase response for notch filter

 

 

 

4-4-1-2 سیگنال صوتی پس از عبور از فیلتر:

p=filtfilt(b,a,c);

figure(4);plot(p);grid on;title('after filter')

 

4-4-1-3  اسپکتروگرام بعد از عبور از اعمال فیلتر:

figure(5);specgram(p,512,fs);title('specgram after notch');

 

 

5-  نتیجه گیری

اسپکتروگرام یک بازنمایی طیفی متغییر با زمان است که چگالی طیفی (غلظت طیفی)سیگنال متغییر با زمان را نشان می دهد و همچنین برای شناسایی صوت، تجزیه تحلیل جیغ و فریاد حیوانات، موزیک، رادارهای خورشیدی، پردازش گفتار و زلزله شناسی به کار گرفته می­شود .در نمودار اسپکتروگرام سطح انرژی با استفاده از رنگ های موجود در طیف قابل شناسایی است.

در علم مهندسی پزشکی نتایج حاصل از اسپکتروگرام روز به روز در حال پیشرفت می باشد  به نحوی که در کمک به غلبه بر نقص گفتار و در آموزش سخنرانی برای بخشی از جمعیت ناشنوا مفید است  .

 

 

6-                     مراجع

 

1- Baken, R.J. and R.F. Orlikoff, Clinical measurement of speech and voice. 2000: Singular Pub Group

2- Behrman, A., Speechand voice science. 2007: Plural Pub Inc.

3- http://home.cc.umanitoba.ca/~robh/howto.htm

4- Matlab software, help, version 7.6.0.324(R2008).

5- http://en.wikipedia.org/wiki/Spectrogram


مطالب مشابه :


پروژه ها و مقالات شبیه سازی شده در متلب- پردازش سیگنال و هوش مصنوعی

با متلب ، انجام پروژه پردازش تصوير با متلب ،انجام پروژه پردازش سیگنال ، مهندسی
دانلود جزوه پردازش سیگنال های تصاویر دیجیتال با متلب، جزوه پردازش تصویر دیجیتال، جزوه پردازش تصویر

دانلود جزوه پردازش سیگنال های تصاویر دیجیتال با متلب، جزوه پردازش پردازش سیگنال
مطالعه پردازش سیگنال ( اسپکتروگرام) و کاربرد های آن و چگونگی رسم آن در متلب

مطالعه پردازش سیگنال با متلب ، انجام پروژه پردازش تصوير با متلب ،انجام پروژه
پردازش صدا با مطلب ( بخش دوم )

پردازش صدا با مطلب ( بخش دوم ) در بخش به نحوه ذخیره سازی سیگنال صوتی می پردازیم .
پردازش تصویر

با متلب ،انجام پروژه پردازش سيگنال با متلب پروژه مهندسي برق با نرم نویز سیگنال
پردازش تصویر در متلب (Image processing)

پردازش تصویر در متلب ای از دانش رایانه است که با پردازش سیگنال دیجیتال که
پروژه های متلب

TMS320F2812 در پردازش سیگنال با نرم افزار MATLAB. • پنهان‌نگاری تصاویر یا Steganography با متلب
پروژه ها و مقالات شبیه سازی شده در متلب- برق قدرت

با متلب ،انجام پروژه پردازش سيگنال با متلب پروژه مهندسي برق با نرم نویز سیگنال
پردازش صدا با مطلب ( بخش اول )

یکی از امکانات مطلب توانائی پردازش سیگنال و صوت است در این سری آموزش پردازش صدا با
مقالات و پروژه های مورد نیاز خود را در این قسمت پیدا کنید

انجام پروژه پردازش سيگنال با متلب پروژه مهندسي برق سازی شده پردازش سیگنال و
برچسب :