پردازش صوت

پردازش صوت و تصویر
پروژه های انجام شده در موضوع پردازش صوت و تصویر : تشخیص چهرهFace Recognition and Detection تشخیص جنسیت از روی چهره تشخیص چهره به روش PCA با استفاده از دیتابیس تشخیص چهره با استفاده از هیستوگرام تصاویر (به همراه مقاله) تشخيص چهره انسان با استفاده طبقه بندي كننده چندخطي تشخيص چهره انسان به روش تحلیل تفکیکی خطی دو بعدی 2D-LDA (به همراه مقاله) تشخیص چهره از روی چشم به روش شبکه عصبی تشخیص چهره با استفاده از روش ویولا جونز(viola and jonz ) تشخیص جنسیت از روی چهره افراد تشخیص جنسیت از روی صدای افراد تشخیص پوست افراد مشخص کردن آن در تصویر تشخیص اثر انگشت به روش دیتابیس (به همراه مقاله) تشخیص حرکت از طریق ورودی دوربین یا وبکم تشخیص کارکتر و عدد در تصویر OCR تشخیص و شمارش یک حرف خاص در تصویر تشخیص عدد فارسی در تصویر (به همراه آموزش فارسی) تشخیص حروف فارسی در تصویر به روش تطبیق الگو تشخیص حروف فارسی در تصویر به روش شبکه عصبی تشخیص سایه و متمایز ساختن آن در تصویر برنامه تشخیص اثر انگشت با استفاده از دیتابیس (همراه با مقاله) برنامه تشخیص بارکد barcode برنامه تشخیص بارکد شامل تشخیص محل بارکد از روی تصویر محصول، استخراج عدد و تشخیص کشور سازنده ترمیم تصویر Image inpainting ترمیم ویدئو Video inpainting کاهش نویز در تصویرNoise Canceling تشخیص لبه تصویر توسط الگوریتم کلونی مورچه ها ACO (به همراه مقاله) تشخیص دایره در تصویر پنهان‌نگاری تصاویر یا Steganography با متلب پنهان نگاری تصویر به روش DCT و LSB پنهان نگاری تصویر در فایل صوتی تشخیص سرعت خودرو به کمک پردازش تصویر تشخیص تعداد خودرو به کمک پردازش تصویر جدا سازی دندان از تصاویر X-ray به کمک پردازش تصویر فشرده سازی تصاویر به روش های DTC2 ، SVD و WAVELET تعیین سلامت میوه مانند سیب به کمک پردازش تصویر (كيفيت سنجی) برنامه شناسایی تومور مغزی در عکس گرفته شده از مغز MRI تشخیص غدد سرطانی (سرطان سینه) به کمک پردازش تصویر تشخیص و شمارش دانه های برنج در تصویر هیستوگرام بدون استفاده از دستور (histeq) متلب استخراج پلاک خودرو از کل تصویر تشخیص پلاک خودرو (پلاک های ایران) تبدیل تصاویر سیاه و سفید به تصاویر رنگی با MATLAB شمارش افراد عبوری از مقابل دوربین تبدیل نت موسیقی به صدا و بر عکس متعادل سازی هیستوگرام بدون استفاده از دستور (histeq) متلب حذف نویز از صوت به روش FIR-filter جدا سازی دندان از تصاویر X-ray به کمک پردازش تصویر تشخیص لبه به روش کلونی مورچه ها ACO ویرایش تصاویر شامل تبدیل به سیاه و سفید، شطرنجی کردن یک قسمت، ترکیب دو عکس، دایره در تصویر و پخش چند تصویر به صورت فیلم تشخیص و شمارش دانه های برنج در تصویر حذف نویز از تصویر بدون توابع کتابخانه ای متلب تشخیص ...

پردازش صدا با مطلب ( بخش دوم )
دوباره با بخش دوم آموزش پردازش صوت در مطلب برگشتم همون طور که در جلسه اول هم گفتم برای درک مطالب این بخش باید با برنامه نویسی در MATLAB آشنا باشید /.... با تشکر در بخش به نحوه ذخیره سازی سیگنال صوتی می پردازیم . برای ذخیره صدا از دستور زیر استفاده می کنیم : Start(xxxx); که در اینجا xxxx همان متغییر است که صدا در داخل آن ذخیره می شود و ما هر بلای که می خواهیم سرش بیاریم سر این متغییر می آریم . چون در مباحث قبلی از متغییر X استفاده کردیم در اینجه هم به این صورت استفاده می کنیم : Start(X); در این مرحله صدا ضبط شده و در داخل متغییر X ریخته شده حال می خواهیم پردازش را شروع کنیم . چه جوری ؟ همان طور که می دونید مطلب با ماتریس تعریف می شود یعنی باید این صوت رو به یک ماتریس تبدیل کنیم برای این کار از دستور زیر استفاده می کنیم که مثال دستورات بالا هستش : Y = Getdata(X); به وسیله این دستور ما فایل ذخیره شده صوتی رو به یک ماتریس تبدیل ممی کنیم و همین طور در متغییر Y می ریزیم که تعداد ستون های این ماتریس برابر با 1 و تعداد سطر های آن بستگی به rate‌ و time دارد که در ابتدا آنها رو توضیح دادم . همین طور برای نمایش اطلاعات به صورت یک نمودار می توان از دستور زیر استفاده کرد که متغییر Y که ماتریس در آن ذخیره شده رو رسم میکنه . فرم کلی دستور برابر است با : Plot (Y); خوب حالا در عمل . دستورات زیر را که تک تک آنها را در بالا بررسی کردیم را در داخل یک پروژه M-file نوشته و اجرا کنید . البته قبلش یک میکروفن به ورودی کارت صوتی خود نصب کنید . توجه : ویندوز مورد نظر XP باشه 100٪ جواب می گیرید . زمان نمونه برداری هم برابر با 8 ثانیه می باشد یعنی همین قد وقت برای صحبت و ضبط سیگنال صوتی خود دارید . شروع کنید : X=analoginput(‘winsound’); Addchannel(X,1:2); Set(X,’samplerate’,28000); Set(X,’samplespertrigger’,244000); Start(X); Y = Getdata (Y); Plot(Y); پس از اجرای دستورات فوق نمودار سیگنال صوتی ضبط شده برای شما رسم می شود . بخش دوم هم در اینجه به آخر می رسه . از عکس فعلا استفاده نمی کنم چون حال و حوصله ای مرتب کردن رو آرشیو مطالب و آپلودرها رو ندارم . ولی اگه لازم بود حتما براتون قرار می دم تا دچار سر در گمی نشید . اگه سوالی داشتید من در خدمتم . منابع : hoperf-12 و مخ خودم
پردازش صدا با مطلب ( بخش اول )
برای درک این مبحث باید با برنامه نویسی در مطلب آشنا باشید /... با تشکر نمی دونم اول از مبحث پردازش صوت شروع کنم یا نرم افزار مطلب !!!!! اول می ریم سر پردازش صوت . امروزه پردازش صوت کاربردی های زیادی در صنعت و مباحث امنیتی و نظامی پیدا کرده از کاربردهاش می شه . نمونه ای از کاربردها کنترل وسایل با صدا کردن و نام بردن کنترل بازی های رایانه ای با صحبت کردن تماس تلفنی بدون لمس کردن کلید های تلفن و فقط با بردن نام اشخاص ( مثلا سیروس خان ) سیستم های امنیتی تشخیص صدا ترجمه همزمان یک زبان به زبان دیگر و برای همین گفتم که این چندتا پست رو بدم و شما رو با این روش استفاده کنم . البته بعد از آموزش با مطلب چند نمونه مدار عملی هم با میکرو کنترلر و همین طور IC مشهور HM2007 که قابلیت یاد گیری دارد را مورد بررسی قرار خواهیم داد . حالا نوبت به مطلب می رسه . دقیقا ترم 2 برق-الکترونیک بودم که شروع به یادگیری نرم افزارهای مربوط به رشته خودم کردم در ابتدا اصلا تصور نمی کردم که روزی بخوام مطلب یا همون آزمابشگاه ریاضی رو یاد بگیرم و دلیلش هم این بود که اصلا آشنائی با این نرم افزار نداشتم ولی الان هر جا به بن بست می رسم مطلب ......... یکی از امکانات مطلب توانائی پردازش سیگنال و صوت است در این سری مقالات در ابتدا برای دوستان دستورات موجود در باکس پردازش صوت رو توضیح می دهیم و در بخش آخر دو صدا را با هم مقایسه می کنیم یکی از کاربردهای این کار مورد استفاده در سیستم های امنیتی است مانند درهای تشخیص صدا و یا صندوق پول ( با لهجه گفتم ) . اولین کاری که ما باید در پردازش صدا انجام دهیم این است که صوت را به صورت سیگنال از ورودی دریافت کنیم برای این کار از کارت صوتی استفاده می کنیم و با دستور زیر آن را در مطلب پیکربندی میکنیم : X= analoginput(‘winsound’); در واقع ما با این دستور کارت صدا را در حالت ورودی پیکر بندی کردیم تا سیگنالهای صوتی را دریافت کنیم و مورد پردازش قرار دهیم . در مرحله بعد کانال ورودی را باید در یکی از حالتهای Stereo و یا mono قرار دهیم . برای قرار دادن در حالت mono باید جای S عدد 1 و زمانی که می خواهیم در حالت Stereo قرار دهیم باید عدد ترکیبی 1:2 را قرار دهیم فرم کلی و یک مثال : Addchannel(X,S); Example : addchannel(X,1:2); در مثال بالا من سیگنال ورودی که در متغییر X قرار داده بودم رو در حالت Stereo قرار دادم . خوب حالا به مرحله ای می رسیم که باید یک نرخی برای نمونه برداری تعیین کنیم - ( سرعت نمونه برداری ) – برای این کار می توانیم از دستور زیر استفاده کنیم و به جای کلمه rate که همان نرخ نمومه برداری است عدد خودمون رو قرار بدیم به KHz مثلا . در ادامه حالت کلی دستور و همین طور 1 مثال برای شما : Set(X,’samplerate’,rate); Example ...
پردازنده های DSP
در لینک ذیل می توانید کتاب پردازنده های DSP را به زبان فارسی دانلود کنید.. دانلود
صوت در متلب
در متلب توابعی وجود دارند که به منظور کار با صوت طراحی شده اند.در این مقاله طرز کار این توابع را با هم مرور می کنیم. beep: ساده ترین دستور تولید صدا در متلب دستورbeepاست که همانطوری که از اسمش پیداست یک صدای بیپ تولید می کند.این صدا برای اجرا به هنگام تولید پیامهای اخطار در برنامه هایتان می تواند مفید باشد.می توان حالت بیپ کامپیوتر را فعال و غیر فعال کرد.به این صورت: beep on beep off اگر حالت بیپ کامپیوتر غیر فعال باشد دیگر دستورbeepتولید صدا نخواهد کرد. wavrecord: این تابع پس از فراخوانی،از یک دستگاه ورودی صدا مثلا میکروفون در زمان مشخصی تحت فرکانس تعیین شده ای صدا را ضبط می کند.توجه داشته باشید که برای ضبط صدا باید سیستم در حال ضبط باشد.برای این منظورvolume controlرا باز کنید.در ویندوزxpبه این آدرس بروید: Start/All Programs/Accessories/Entertainment/Volume control از منویOptionsگزینه یPropertiesرا انتخاب کنید.Mixer Deviceرا در یک حالتInputقرار داده و دکمه ی رادیوییRecordingرا انتخاب کنید. ساختار تابع به این صورت است: data=wavrecord(n,fs); این تابع تعدادnنمونه از یک سیگنال صوتی را تحت فرکانسfsهرتز ضبط می کند و آن را در متغیرdataذخیره می کند.مقدار پیش فرضfsبرابر 11025هرتز است.حال به تناسب زیر توجه کنید: 1secàfs Hz t secàt*fs Hz همانطور که گفته شد تابعwavrecordتعدادnفرکانس را ضبط می کند.بنابراین اگر بخواهیمtثانیه صدا ضبط کنیم بایدt*fsفرکانس را ضبط کنیم.یعنی تابع را تحت این ساختار فراخوانی کنیم: data=wavrecord(t*fs,fs); wavwrite: حال باید صدای ضبط شده را در یک فایل صوتی ذخیره کنیم.برای این منظور از تابعwavwriteاستفاده می شود.این تابع ماتریس حاوی صدای ضبط شده را در یک فایل با پسوند.wavذخیره می کند.فایل تولید شده قابل پخش در کلیه ی برنامه های پخش صداست. wavwrite(data,fs,'filename'); به متغیرfsدر ساختار تابع توجه کنید.مقدار متغیرfsدر ساختار تابعwavwriteباید با مقدار متغیرfsدر ساختار تابعwavrecordبرابر باشد.در واقع باید صدا را با همان فرکانسی که ضبط کرده ایم در فایل ذخیره کنیم.در غیر این صورت صدا زیر یا بم می شود. wavread: این تابع یک فایل صوتی با پسوند.wavرا می خواند و آن را در متغیرdataو فرکانسش را در متغیرfsذخیره می کند. [data fs]=wavread('filename'); wavplay: این تابع ماتریس حاوی صوت را تحت فرکانس مشخصی پخش می کند. wavplay(data,fs); sound: طرز کار این تابع مشابهwavplayاست. sound(data,fs); باز هم یادآور می شوم که برای پخش صدا باید فرکانس پخش با فرکانس ضبط برابر باشد.
آي سي پردازش صوت (hm2007)
اي سي hm2007 يک اي سي پردازش اطلاعات مي باشد به اين صورت که اين مدار از قسمت هايي از جمله رم ، سون سگمنت ، ميکروفن و... تشکيل شده است کار مدار: زماني شما مدار را روشن مي کنيد بر روي 2 سون سگمنت عدد 1 نوشته شده است و شما بايد کليد ضبط را فشار دهيد و در مقابل ان يک کلمه را بگوييد مثلا شما زماني که بر روي سون سگمنت عدد 1 نوشته شده و شما در مقابل ميکروفن کلمه سلام را بگوييد دستگاه صداي شما را ضبط مي کند و بعد از ان هر وقت که شما کلمه سلام را بگوييد . بر روي سون سگمنت عدد 1 ظاهر مي شود شما مي توانيد به اين مدار تا ... (براي خواندن ادامه مطالب بر روي ادامه کليک نماييد) ()تا 40 حرف را بگوييد و دستگاه ان ها را ضيط مي کند و زماني شما يکي از ان 40 کلمه را بکوييد عدد ضبط شده در مقابل ان حرف را بر روي سون سگمنت براي شما نشان مي دهد با استفاده از صفحه کليد و ميکروفن مي‌توانيم کلماتي را (حداکثر ?? کلمه ) به مدار آموزش داده و سپس هرگاه اين کلمات را از طريق ميکروفن بشنود شماره کلمه را روي نمايشگر نشان مي‌دهد. عکس شماتيک مدار در زير قرار داده شده است که به دليل بعضي مسائل به خوبي ديده نمي شود ولي در صورتي که عکس را بر روي سيستم خود ذخيره save کنيد به خوبي ديده مي شود. توضيح کامل تر در مورد مدار: وقتي مدار روشن مي‌شود ابتدا حافظه RAM مدار چک مي‌شود و وقتي همه چيز آماده بود LED قرمز روشن مي‌شود به معني اينکه مدار آماده دريافت فرمان است. براي آموزش مدار ابتدا شماره کلمه‌ را از طريق صفحه کليد وارد کنيد (در اين لحظه LED قرمز خاموش خواهد شد) سپس کليد ? را فشار دهيد، حال مدار آماده دريافت صوت است لذا کلمه مورد نظر را از طريق ميکروفن براي مدار تکرار کنيد. مثلاً فرض کنيد کلمه شماره ? مي‌خواهيم کلمه ”يزد“ باشد. پس کليد ? را فشار داده و سپس کلمه خانه را تلفظ ميکنيم. مدار تلفظ کلمه خانه را در مکان ? حافظه ذخيره مي‌کند. کلمات ديگر را نيز به همين ترتيب مي‌توانيد به مدار آموزش دهيد. تست مدار: مدار تشخيص صدا بطور دائم به اصوات اطراف گوش مي‌دهد و هرگاه کلمات موجود در حافظه‌اش را در بين صداهاي شنيده شده بيابد شماره آن کلمه را روي نمايشگر نشان مي‌دهد. از کاربردهاي بسيار جالب اين مدار مي‌تواند فرمانهاي صوتي باشد. مثلاً بگوئيم ”کولر روشن“ و کولر روشن شود و ... ولی در کل وسیله جالبیه به خصوص واسه تنبل ها
مدار پردازش صوت - Speech Recognition

Speech Recognition یا همان مدار پردازش صوت مداری است که قادر است اصوات پیرامون خود را بوسیله یک میکروفون دریافت و آنها را به کدهای دیجیتال تبدیل کرده و آنها را مورد مصرف قرار دهد حال بنا به نوع کاربرد این مصرف متفاوت خواهد بود. <?xml:namespace prefix = o ns = "urn:schemas-microsoft-com:office:office" /> طرز کار مدار: زمانی شما مدار را روشن می کنید بر روی 2 سون سگمنت عدد 1 نوشته شده است و شما باید کلید ضبط را فشار دهید و در مقابل ان یک کلمه را بگویید مثلا شما زمانی که بر روی سون سگمنت عدد 1 نوشته شده و شما در مقابل میکروفن کلمه سلام را بگویید دستگاه صدای شما را ضبط می کند و بعد از ان هر وقت که شما کلمه سلام را بگویید . بر روی سون سگمنت عدد 1 ظاهر می شود شما می توانید به این مدار تا ... تا 40 حرف را بگویید و دستگاه ان ها را ضیط می کند و زمانی شما یکی از ان 40 کلمه را بکویید عدد ضبط شده در مقابل ان حرف را بر روی سون سگمنت برای شما نشان می دهد با استفاده از صفحه کلید و میکروفن می‌توانیم کلماتی را (حداکثر ۴۰ کلمه ) به مدار آموزش داده و سپس هرگاه این کلمات را از طریق میکروفن بشنود شماره کلمه را روی نمایشگر نشان می‌دهد. عکس شماتیک مدار در زیر قرار داده شده است. توضیح کامل تر در مورد مدار: وقتی مدار روشن می‌شود ابتدا حافظه RAM مدار چک می‌شود و وقتی همه چیز آماده بود LED قرمز روشن می‌شود به معنی اینکه مدار آماده دریافت فرمان است. برای آموزش مدار ابتدا شماره کلمه‌ را از طریق صفحه کلید وارد کنید (در این لحظه LED قرمز خاموش خواهد شد) سپس کلید ? را فشار دهید، حال مدار آماده دریافت صوت است لذا کلمه مورد نظر را از طریق میکروفن برای مدار تکرار کنید. مثلاً فرض کنید کلمه شماره ? می‌خواهیم کلمه ”اصفهان زیبا“ باشد. پس کلید ? را فشار داده و سپس کلمه اصفهان زیبا را تلفظ میکنیم. مدار تلفظ کلمه اصفهان زیبا را در مکان ? حافظه ذخیره می‌کند. کلمات دیگر را نیز به همین ترتیب می‌توانید به مدار آموزش دهید فقط باید دقت کنیم مدت زمان تلفظ از حد معینی بیشتر نباشد. تست مدار: مدار تشخیص صدا بطور دائم به اصوات اطراف گوش می‌دهد و هرگاه کلمات موجود در حافظه‌اش را در بین صداهای شنیده شده بیابد شماره آن کلمه را روی نمایشگر نشان می‌دهد. از کاربردهای بسیار جالب این مدار می‌تواند فرمانهای صوتی باشد. مثلاً بگوئیم ”کولر روشن“ و کولر روشن شودو یا پروژه خودم در جشنواره ۳ سال پیش که با صدا کانالهای تلویزیون را عوض میکردم کدهای خطای مدار: خطاهایی که برای مدار رخ می‌دهد بصورت کدهایی روی نمایشگر ظاهر می‌شود. 55:یعنی کلمه شنیده شده توسط دستگاه خیلی طولانی است۶۶: یعنی کلمه شنیده شده خیلی ...
پردازش تصاویر پزشکی و سیستم های تصویر برداری
پردازش تصاویر پزشکی و سیستم های تصویر برداریتصاویر پزشكی با توجه به آنكه وضعیت بدن را به صورت دو بعدی و حتی سه بعدی (بوسیله كامپیوتر) نشان می‌دهند، یكی از مهمترین وسایل تشخیص برای پزشكان هستند كه همواره بخش عظیمی از تحقیقات را به خود اختصاص داده‌اند. سیستمهای تصویر برداری را می توان به گروههای زیر تقسیم كرد:• روشهای اشعه ایكس (رادیوگرافی، فلوئورسكوپی و ct).• روش مغناطیسی mri .• پزشكی هسته‌ای (nuclear medicine).• روش‌های ماوراء صوت.تصاویر حاصله در روشهای فوق عموماً و به صورت خام قابل استفاده نیستند، لذا پردازشهای وسیع و گسترده‌ای روی آنها صورت می‌گیرد كه عموماً شامل موارد زیر است:• پردازش تصاویر و استخراج اطلاعات موثر در تشخیص و یافتن مواضع مورد توجه (roi).• بازسازی تصاویر در كامپیوتر به صورت سه بعدی و درونیابی اطلاعات جهت تولید برشهای لازم از ارگان تحت تصویر برداری.• حذف نویز، اختصاص رنگ و در كل ارتقاء كیفیت تصویر.پ - پردازش صوت وگفتار و طراحی سیستم های گفتار درمانی و کمک همراه معلولین گفتاریگفتار یکی از علایم بسیار مهم زیستی است که از هوشمندترین موجود روی زمین، یعنی انسان صادر می‌گردد. با توجه به توسعة وسیع سیستم‌های کامپیوتری و اهمیت روزافزون انواع پردازش‌های صوتی و گفتاری در جهان امروز و ارتباط تنگاتنگی که ویژگی‌های گفتار تولید شده با خصوصیات آناتومیک و عصبی دستگاه تولید گفتار و همچنین چگونگی عملکرد سیستم اعصاب مرکزی او دارد، اهمیت پرداختن به این مقولة پرکاربرد مهندسی در دانشکدة مهندسی پزشکی ظاهر می‌گردد. البته علائق و نوع رویکرد برخورد با مسائل مهندسی در این دانشکده باعث تفاوت‌های پایه‌ای و اصولی در نوع برخورد با این مسئله نسبت به دانشکده‌هائی مثل برق یا کامپیوتر و رشته‌هائی مثل مخابرات و کامپیوتر شده‌است. در آن جا معمولاً به سیگنال گفتار به صورت یک سیگنال عادی که حاوی اطلاعاتی است که باید به هر صورت ممکن از آن استخراج گردد، نگاه می شود در حالیکه در دانشکدة مهندسی پزشکی، محققین در پی دنبال کردن مسئله و مدلسازی آن به صورتی هستند که تا حد ممکن با اصول عملکرد جهاز صوتی و مبانی زیستی تولید گفتار در انسان هماهنگی داشته باشد و سعی می‌نمایند از روش‌های استخراج ویژگی و مدل‌هائی استفاده کنند که به روش‌های زیستی انسانی نزدیکتر باشندموارد دیگر مربوط به این رشته، طراحی و ساخت وسائل و تجهیزات تشخیصی مثل شنوائی سنجی و ثبت و پردازش سیگنال‌های برانگیختة شنوائی، انجام پردازش های لازم در اعضای مصنوعی شنوائی مثل حلزون مصنوعی گوش و ساخت دستگاه‌هائی است که به کمک افراد لال و یا دارای ...