تبلیغات
کاملترین بانک مقالات فارسی آسیب شناسی گفتار و زبان - طیف نگاری
نوع مطلب: صوت ،

سیگنال گفتاری به دو صورت بازنمایی می­شود:1) بازنمایی در واحد زمان که همان شکل موج است. در این بازنمایی ما می­توانیم خود شکل موج، دوره تناوب آن، پریودیک یا غیرپریودیک بودن شکل موج و آشفتگی­ها را مشاهده کنیم. 2) بازنمایی در واحد فرکانس: این نوع بازنمایی همان کاری است که اسپکتروگرافی انجام می­دهد و یک تصویر سه بعدی برای ما فراهم می­کند. در این نوع بازنمایی ما هم فرمنت­ها و هم هارمونیک­ها را می­توانیم بخوبی مشاهده کنیم.

طیف نگار برای ما یک طیف نگاشت ایجاد می­کند که یک نمایش گرافیکی از انرژی اجزا فرکانسی سیگنال گفتاری است. به طور قراردادی، زمان روی محور x، فرکانس روی محور yو انرژی یا دامنه سیگنال روی محور zنمایش داده می­شود.

انرژی معمولا با خطوط عمودی تیره نمایش داده می­شود که هرجه تیره­تر باشد، به معنای وحود انرژی بیشتر می­باشد.

اسپکتروگرافی بر پایه تئوری Fourier  می­باشد که می­گوید همه امواج پریودیک قابلیت تجزیه شدن به امواج سینوسی با دامنه­های متفاوت می­باشند که فرکانس­های آنها با یکدیگر نسبت صحیحی دارند.  Fourier analysisفرایندی است که یک موج پیچیده را به موج­های سینوسی ساده تبدیل می­کند.

* Narrowband and Wideband spectrogram:

همانطور که می­دانید رابطه بین زمان و فرکانس عکس است و در حالیکه F=1/tعکس آن t=1/Fنیط صحیح می­باشد. اسپکتروگرام ممکن است اطلاعاتی در مورد ساختارهای هارمونیکی منبع سیگنال و یا اطلاعاتی در مورد ویژگی­های تشدیدی مجرای صوتی بدهد. هر دوی این مجموعه از اطلاعات، نمی­توانند به طور همزمان نمایش داده شوند، چونکه همانطور که ذکر شد زمان و فرکانس عکس هم هستند.

زمانیکه اطلاعات فرکانسی و یا زمانی نمایش داده می­شوند، این جزئیات به frequency resolution (شفافیت فرکانسی) و یا  time resolution( شفافیت زمانی) ارجاع داده می­شود. Resolution  به معنایFilter bandwidthتوصیف می­شود. حال به توصیف انواع اسپکتروگرام می­پردازیم:

* Wideband spectrogram:  

دارای پهناد باند زیادی است که تعدادی فرکانس را در یک زمان عبور می­دهد و به همین خاطر فرکانس­های خروجی از آن قابل تمایز از یکدیگر نیستند.

از دیگر ویژگی­های ان می­توان به موارد زیر اشاره کرد:

1- frequency resolutionضعیفی دارد

2- time resolutionخوب است.

3- در آن هارمونیک­ها با هم ترکیب می­شوند و از یکدیگر قابل تمایز نیستند.

4- ساختار فرمنتی را به خوبی نشان می­دهد.

5- می­توان در آن پاالس­های حنجره را مشاهده کرد.

* Narrowband spectrogram:

دارای پهنای باند کمی می­باشد و تنها یک فرکانس را در واحد زمان از آن عبور می­کند، بهمین خاطر در خروجی آن همه فرکانس­ها از یکدیگر از یکدیگر قابل تمایز هستند. از دیگر ویژگی­های آن می­توان به موارد زیر اشاره کرد:

1- frequency resolutionخوبی دارد.

2- time resolutionضعیف است(زمان زیادی برای فیلتر کردن گفتار نیاز دارد).

3- در آن هارمونیک­ها از یکدیگر قابل تمایز اند.

4- ساختار فرمنتی را به خوبی نشان نمی­دهد.

5- نمی­توان در آن پاالس­های حنجره را مشاهده کرد.

* ایجاد اسپکتروگرافی گفتار:

1- Direct (speech) Translator:

از ابزارهایی که می­توانند با استفاده از فیلنرها یک تصویر سه بعدی ایجاد کنند Direct (speech) Translatorمی­باشد. این ابزار دوازده فیلتر آنالیز کننده را بکار می­برد که هرکدام دارای پهنای باند Hz300 می­باشد که کل محدوده­ی فرکانسی تحت پوشش آن  Hz3600 می­باشد. هر فیلتر با یک لامپ کوچک ارتباط دارد زمانیکه هر کدام یک از این لامپ­ها روشن می­شود، یک نمودار از روشنایی بر روی نوار متحرک از فسفروسنت تولید می­شود. هر چه شدت خروجی فیلتر بیشتر باشد، نور تولید شده بوسیله لامپ مرتبط با فیلتر بیشتر خواهد بود و اثر آن روی نوار فسفرسنت بیشتر خواهد بود. بنابراین درجات محتلف روشنایی برای ایجاد یک نمایش سه بعدی فراهم می­شود.

باند­های با فرکانس پایین در پایین، و باندهای با فرکانس بالا در بالای آن قرار می­گیرند. تونایی این ابزار به تعداد فیلترها محدود می­شود. و به عبارت دیکر براد محدوده­ی فرکانسی بیش از Hz3000، لازم است که هر فیلتر یک یک باند پهن داشته باشد، که در غیر این صورت بخشی از جزئیات از دست داده می­شود. به عبارت دیگر کاهش پهنای باند فیلترها، منجر به کاهش محدوده­ی فرکانسی نمایش داده می­شود.

2- sonagraph:

در اینجا یک جمله کوتاه برای انالیز کردن روی یک نوار ضبط می­شود، سپس چندین بار پخش می­شود و سپس گفتار وارد یک فیلتر می­شود، فرکانس مرکزی فیلتر (فرکانسی که در میانه باند فرکانسی قرار دارد) به تدریج به سمت بالا حرکت می­کند. نا زمانیکه حداکثر فرکانس بدست آید. در این شیوه ، از یک فیلتر برای ایجاد مجموعه بزرگی از فیلتر­ها استفاده می­شود.

خروجی فیلتر به یک قلم سوزنی وصل است که به یک صفحه­ی کاغذی حساس به الکتریسیته ارتباط دارد، که روی یک بخش استوانه­ای مانندی قرار دارد. این استوانه به همراه نوار ضبط شده می­چرخد. خروجی قویتر از فیلتر، اثرات تیره­تری روی کاغذ ایجاد می­کند. هنگامیکه فرکانس مرکزی فیلتر به سمت بالا حرکت می­کند، قلم سوزنی هم از پایین به بالای کاغذ منتقل می­شود. در این شیوه، اثرات خروجی از تکرار مجموعه­ها روی یکدیگر ضبط می­شوند. در مورد sonagraph، انچه روی کاغذ ثبت می­شود، دائمی بوده در حالیکه در Direct (speech) Translatorیک نمایش موقتی روی نوار فسفری ایجاد می­شود. در اینجا شدت در ارتباط با تیرگی است.

3- Digital Methods:

با پیشرفت تکنولوژی این امکان بوجود آمد که از کامپیوترها برای تعیین خروجی فیلترها استفاده شود، بنابراین زمان زیادی برای ایجاد فیلترهای واقعی نیاز نبود، این باعث شد که این شیوه انعطاف پذیرتر شود و به کاربر فرصت انتخاب محدوده­ی فرکانسی و طول موقتی هر اسپکتروگرام را بدهد.

* ویژگی­های اسپکتروگرام واکه­ها:

برای اینکه یک واکه ایجاد شود باید یک درجه­ی کوچکی از تنگی مجرای صوتی در مکان­های مختلف در طول مجرای صوتی رخ دهد. جایگاه تنگی و درجه آن می­تواند برای تشخیص خروچی آکوستیک واکه­ها بکار برده شود.تنگی در مجرای صوتی بوسیله­ی حرکات زبان، لب، فک و همچنین انقباض دیواره­های حلق رخ می­دهد.

پس شکل مجرای صوتی، سازه­های فرکانسی را مشخص می­کند و اینکه روابط بین سازه­های فرکانسی، یک نمایش آکوستیکی از واکه­ها برای ما فراهم می­کند. اما پوسچر مجرای صوتی خیلی پیچیده­تر از توصیف ساده­ی ارتفاع و پیشروی زبان است ( که در گذشته برای توصیف واکه­ها به کاربرده می­شد) پس بهتر است در بررسی واکه­ها از روابط بین سازه­های فرکانسی استفاده کرد. که در زیر به توصیف دقیق­تر ارتباط بین حرکات اندام­های تولیدی و سازه­های فرکانسی می­پردازیم:

F1، ارتباط معکوسی با ارتفاع واکه دارد. این بدان معنی است که هنگامیکه واکه بازتر می­شود، F1افزایش می­یابد. که این ویژگی­ها برای هر دوی واکه­های خلفی و قدامی است. بنابراین F1اثر معکوسی روی درک ارتفاع واکه دارد. ارتباط F2و ارتفاع واکه از قطعیت کمتری برخوردار است. برای واکه­های قدامی F2، هنگامیکه واکه باز می­شود، کاهش می­یابد. برای واکه­های خلفی، ارتباط واضحی دیده نمی­شود.

در مورد پیشروی واکه، زمانیکه واکه از خلف به قدام حرکت می­کند، بطور کلی F2افزایش می­یابد، اما این نکته همیشگی و ثابت نیست. و همانطورکه گفتیم گردی لبها باعث کاهش همه فرمنت­ها می­شود. محتمل­تر این است که درک پیشروی واکه یک عملکرد از هر دوی F1و F2است. هرگاه F1و F2به سمت یکدیگر حرکت کنند، درک واکه به عنوان یک واکه خلفی بیشتر می­شود.

پس بطور خلاصه می­توان ویژگی­های اسپکتروگرام واکه­ها را به این شکل بیان کرد:

1- اختلاف میان واکه های مختلف را، اختلاف بین دوفرمنت اول (f1 ,f2)مشخص می کند

2- هنگام تولید واکه ها دو حفره تشدید کننده صوتی توسط زبان ایجاد می شود

3- حفره پشتی زبان با f1در ارتباط است

4- حفره جلویی زبان با f2در ارتباط است

5- هرچه حفره جلویی زبان کوچکتر باشد  f2بیشتر است

در واکه­های خلفی و قدامی :

1- F1ارتباط دارد با ارتفاع واکه (vowel height)یا برخاستگی زبان

2- هرچه ارتفاع واکه کمتر(دهان بازتر) درنتیجه f1بیشتر

3- ارتباط  f2با ارتفاع واکه های خلفی کاملا مشخص نیست

در پیشروی واکه:

1- از خلف به سمت قدام: f2  افزایش پیدا می کند (ثابت و همیشگی نیست) و با گردشدگی لبها همه فرمنت­ها کاهش می­یابند.

 2- پس در واکه های خلفی فاصله f1وf2از یکدیگر کمتر از واکه های قدامی است

3- در حرکت واکه از خلف به سمت قدام: فاصله f3وf2با یکدیگر کمتر می شود

* عوامل موثر بر طیف واکه­ها:

1- شکل مجرای صوتی:

ارتباط بین سازه­های فرکانسی با شکل مجرای صوتی ثابت و قطعی نیست به این علت که حرکات و درجات آزادی متفاوتی وجود دارد  که می­توانند تعداد نامحدودی از اشکال مجرای صوتی را برای تولید یک سازه­ی فرکانسی بوجود آورند.

بطور کلی روابط زیر در ارتباط با تاثیر شکل مجرای صوتی بر طیف واکه­ها مطرح می­باشند:

الف) هر چه طول مجرای صوتی بیشتر باشد، فرکانس همه فرمنت­ها کاهش می­یابد.

ب) گردی لبها منجر به کاهش همه فرمنت­ها می­شود

ج) تنگی خلفی دهان (بالا رفتن بخش خلفی زبان) منجر به کاهش F2می­شود.

د) تنگی قدامی دهان (بالا رفتن نوک زبان) منجر به کاهش F1و افزایش F2می­شود.

ه) تنگی حلقی باعث افزایش F2می­شود

2- شدت یا تلاش صوتی:

هنگامیکه شدت صوتی افزایش می­یابد، باعث افزایش دامنه F2و F3می­شود.

3- سرعت گفتار:

اثر سرعت تولید هجا روی سازه­های فرکانسی هنوز نامشخص است. بگونه­ای که Kritaniمی­گوید که فرمنت­ها خصوصا F2با افزایش سرعت گفتار تغییر می­کند (چون دیرش واکه کاهش می­یابد)، در حالیکه Gayو Engstrandمی­گویند هنگامی که سرعت هجاها از آهسته به سریع تغییر می­کند، تغییری در فرمنت واکه­ها دیده نمی­شود.

ویژگی­های طیفی همخوان­ها:

الف) همخوان­های انسدادی:

در اسپکتروگرام همخوان­های انسدادی ما 4 ویژگی مهم مشاهده می­کنیم: 1- شکاف انسدادی 2- رهش 3- گذر سازه­ای  4- انفحجار رهشی

1- شکاف انسدادی: شکاف انسدادی یا silence، در طی تولید انسداد قبل از رها شدن جریان هوا رخ می­دهد. که برای همخوان­های انسدادی بی­واک (p/t/k) به شکل کامل رخ می­دهد و برای همخوان های واکدار (b,d,g) در طی این انسداد ارتعاش تارهای صوتی رخ می­دهد که صوتی با یک دامنه کم تولید می کند که از آن تعبیر به voice barمی شود.

2. انفجار رهش: یک نویز انفجاری گذراست که هنگام رها شدن انسداد رخ می دهد. این نویز ناشی از این است که در هنگام  انسداد فشار داخل دهانی افزایش پیدا می­کند و بیشتر از فشار اتمسفر می شود. انفجار رهش ناشی از برخورد ناگهانی این دو فشار است که برای همخوان واکدار 10-30 msو برای همخوان بی واک مقداری طولانی تر است.

این انفجار باعث تغییرات ناگهانی در دامنه بعد از stop gapمی شود. که در اسپکتروگرام ممکن است به شکل وجود انرژی ناگهانی در همه فرکانس ها بلافاصله بعد از شکاف دیده شود.

3. دمش: دمش مشابه با سایشی بی واک /h/می باشد یا یک آه بی واک و سریع که باعث  ایجاد نویز گسترده در بین همه فرکانس ها می شود.  در انسدادی های بی واک و در موقعیت اول، ممکن است دمش دیده نشود. و معمولا در انسدادی های واکدار دمش بعد از رها شدن انسداد دیده نمی شود.

4. گذر سازه ای: برای گذر سازه ای (انتقال فرمنتی) همخوان های انسدادی ویژگی های زیر مطرح شده است:

1. در انسدادی های دو لبی (p/b): انتقال فرمنت ها –خصوصا f2و f3–را به سمت پایین داریم.

2. در انسدادی های لثوی (t/d): f3تمایل به افزایش دارد.

3. در انسدادی های کامی (k/g) : نزدیک شدن f2و f3را داریم که به آن velar pinchگفته می­شود.

اما Bakenمهمترنی ویژگی های همخواهنهای انسدادی را به شرح زیر بیان می کند:

انسدادی های دولبی تمرکز انرژی شان در فرکانس های پایین است (500-1500 هرتز)
انسدادی های لثوی تمرکز انرژی شان در فرکانس های بالای 4000 هرتز می باشد.
انسدادی های کامی تمرکز انرژی شان در فرکانس های 1500 تا 4000 هرتز می باشد.
ب. همخوان های سایشی

طبق تعریف، سایشی ها شامل یک انسداد در مجرای صوتی اند که برای ایجاد نویز(سایش) بزرگ اند. که میزان این انسداد یا تنگی در میان سایشی­های مختلف متفاوت است اما برای ایجاد جریان هوای آشفته در همه آن ها کافی است. جریان هوای  آشفته (نویز سایشی) در سایشی­های بی واک (/f/š/s/h/) به عنوان تنها منبع صوتی می باشد. در سایشی های واکدار (/v/ž/z) هم نویز سایشی سوپراگلوت و هم منبع صوتی را داریم.

ویژگی های گذر سازه ای در همخوان های سایشی:

سایشی های لثوی (/s/z/) و کامی  (š/ ž) با درجه تنگی بیشتری تولید می شوند که در قسمت خلفی دهان است، که فضای تشدیدی بزرگتری ایجاد میکند که نتیجه­ی آن  نویز سایشی با انرژی بیشتر و f  بالاتر می­باشد.
در سایشی­های لثوی اغلب انرژی در فرکانس­های بالای f2تمرکز یافته است.
در سایشی­های کامی اغلب انرژی در فرکانس­های بالای f3تمرکز یافته است.
در صدای /s/در همه فرکانس ها نویز وجود دارد، در حالیکه در صدای /š/نویز در پایین طیف کاهش می یابد (گاهی مواقع در زیر 1500-2000 هرتز نویزی نداریم).
جفت های واکدار (/z/ ž/) از طریق سه ویژگی از جفت های بی واک (/s/š/) تمییز داده می­شوند: الف. دامنه کمتر سایش در جفت های واکدار، ب. دیرش کمتر نویز سایشی در جفت های واکدار ج-  وجود voicing barدر جفت های واکدار.
در سایشی های لبی –دندانی (/f/v/) طیف پهن اما با انرژی کم را مشاهده می کنیم.
در سایشی های خلفی/چاکنایی /h/: این نوع سایشی مانند aspiration noiseاست که طی آن جریان هوا از یک چاکنای باز عبور می کند که انرژی کم در طیف آن دیده می شود. در برخی منابع، اسپکتروم نویز /h/را به عنوان اپی گلوتال عنوان می کنند که استدلال می کنند که هوا به سمت مانع اپی گلوت هدایت می شود.
ج. همخوان های خیشومی:

همخوان های خیشومی بوسیله انسداد حفره دهان، باز شدن دریچه کامی حلقی، و جریان مداوم هوا از طریق حفره بینی تولید می شوند. شکل حلق برای همخوان­های خیشومی مشابه است، که این موضوع منجر به قله های فرمنتی مشابه در این همخوان ها می شود. در این همخوان ها، در واقع ما جفت تشدید کننده و ضد تشدید کننده داریم و اضافه شدن این ضد تشدید کننده به عملکرد فیلترینگ، منجر به کاهش انرژی هارمونیک­ها می شود. در مورد همخوان های خیشومی Behrmanمی گوید که ساختار فرمنتی مشابه واکه ها دارند ولی برخلاف واکه ها با درجه تنگی بزرگتری رخ می دهند.

ویژگی های اکوستیکی همخوان های خیشومی:

F1در حدود 500 –1500 کاهش می یابد.
F2 و f3در همخوانهای خیشومی متنوعند (معمولا در بالای f1هیچ گونه فرمنتی را در بر نمیگرد).
علامت برجسته آن ضعف باندهای فرمنتی است که ناشی از سطح پایین انرژی در تمام مدت زمان تولید همخوان ها می باشد.
برای واکه ای که قبل از یک همخوان خیشومی دولبی /m/می آید، کاهش f2را قبل از همخوان دولبی در بافت vcو کاهش آن را بعد از همخوان دولبی در بافت vcمشاهده می کنیم.
با وجود اینکه موارد بالا کر شد، توجه به این نکته مهم است که شواهد اکوستیکی برای جایگاه تولید در خیشومی ها واضح نیست و اسپکتروگرافی برای تعیین درجه نیزالیتی چندان کمک کننده نیست.

Vowel nasalization:

نیزالیزیشن در واکه ها به اضافه شدن یک تشدید خیشومی به عمکلرد فیلتر مجرای صوتی اطلاق می شود.خیشومی شدگی واکه ها به علت هماهنگی تولید(coarticulation) رخ می دهد. در ترکیبات cvکه همخوان یک نیزال است، بخش vpدر هنگام پیش بینی همخوان نیزال باز می شود در حالیکه واکه هنوز تولید می شود. به عبارت دیگر واکه ی نزدیک همخوان خیشومی ، خیشومی می شود. به گونه ای مشابه، در ترکیبات cv، بخش vpهنوز در حال بسته شدن است که واکه ی بعد از همخوان نیزال تولید می شود و واکه خیشومی می شود.

جفت شدن (اتصال ) فضای تشدیدی میزال با حفره حلقی دهانی، فرمنت های مجرای صوتی را به شکل پیچیده ای تغییر می دهد. خیشومی شدگی یک anti-resonanceبه عملکرد فیلتر مجرای صوتی اضافه می کند که انرژی هر هارمونیک را که نزدیک به فرکانس مشابه anti-resonanceاست ، را کاهش می دهد.

در اسپکتروگرام، جایگاه anti-resonanceاغلب در کاهش / فقدان انرژی هارمونیک قابل مشاهده است.

د. همخوان های غلتان (glide):

همخوان های غلتان (W/J) از طریق تغییر شکل قابل تمییز یافتن از واکه های مجاور نمی باشند. چون که منبع صوتی near periodicدارند و هیچ گونه وقفه ای در طی شکل موج آن ها رخ نمی دهد (مثل شکاف انسدادی، انفجار رهشی، نویز سایشی و ...). بنابراین برای فهم علائم آکوستیکی آن ها بهتر است از ویژگی طیفی آن ها استفاده شود.

صداهای (W/J) از لحاظ آکوستیکی و فیزیولوژیکی مشابه با (i//u) هستند و زمانیکه با یک واکه ترکیب می شوند الگویی از تغییرات فرمنتی مشابه با diphthongها ایجاد می کنند. اما این همخوان ها از لحاظ اکوستیکی  با واکه های /i/و /u/تفاوت دارند که این تفاوت ها شامل:

F3در /w/معمولا ضعیف است.
F3در /j/دارای فرکانس بالاتری نسبت به /i/می باشد.
ویژگی های گذر سازه ای برای همخوان های غلتان:

شواهد اکوستیکی برای مکان تولید همخوانهای غلتان: انتقال فرمنتی است.

برای غلتان های کامی /j/و دولبی /w/در بافت cv، f1از فرکانس پایین به سمت یک حالت بالا و ثابت از واکه بعدی می رود (افزایش می یابد). که دلیل این افزایش رها شدن حالت گردی لبها برای هر دوی /w/و /j/می باشد.

اما f2هنگامی که /w/به سمت واکه بعدی حرکت می کند باز هم افزایش می یابد، ولی در /j/به سمت پایین حرکت می کند.

ه. همخوان های روان:

همخوانهای روان /l/r/از طریق شکل موج قابل تمایز از واکه های مجاور نمی باشند، به همان دلایلی که در همخوان های غلتان توضیح داده شد. اما این ویژگی در مورد صدای /l/به طور کامل صدق نمی کند چون که یک وقفه کوتاه در این صدا دیده می شود.

در همخوان /l/شواهد اکوستیکی برای شیوه تولید برای شیوه­ی تولید تولید آن به علت خروجی طرفی جریان هوا پیچیده است. که در این همخوان هر دوی فرمنت و آنتی فرمنت روی عملکرد فیلتر آکوستیکی تاثیر می­گذارد. در این صدا جریان هوا به علت انسدادی که در بخش مرکزی لثوی ایجاد ی­شود به طرفین می­رود، که این انحراف منجر به اضافه شدن آنتی فرمنت به عملکرد فیلترینگ می­شود.

در همخوان /l/ ما تغییرپذیری بالای فرمنت­ها را به خصوص F2را داریم. و ویژگی­های فرمنتی آن بسیار مشابه با هم ارگانیک خیشومی /n/ است.

در همخوان /r/ ما کاهش شدید F3را داریم که به F2نزدیک می­شودو ما می­توانیم velar pinchرا مشاهده کنیم.

و)همخوان­های سایشی-مرکب

این همخوان­ها، انسدادی­هایی هستند که بوسیله یک سایشی هم ارگانیک دنبال می­شوند(ts/d3). در این صداها انسداد رها می­شود ولی تنگی برای ایجاد حالت نویز سایشی بعد از انفجار هوا باقی می­ماند. شواهد آکوستیکی برای این صداها مشابه با همخوان­هی انسدادی و سایشی می­باشد.

 

References:

 

1- Baken, R.J. and R.F. Orlikoff, Clinical measurement of speech and voice. 2000: Singular Pub Group

2- Behrman, A., Speechand voice science. 2007: Plural Pub Inc.

3- http://home.cc.umanitoba.ca/~robh/howto.html

آخرین بروزرسانی (یکشنبه, 31 اردیبهشت 1391 ساعت 18:52)

   


نظرات()

بانک مقالات آسیب شناسی گفتار و زبان

رسول علیدوستی - مرکز آموزش عالی علوم پزشکی وارستگان