66.3ª.02 VOZ ESOFÁGICA: ERIGMOFONIA.

Provox Vega Voice Prosthesis, 22.5 FR, 6 mm

Provox Vega Voice Prosthesis, 22.5 FR, 6 mm

 

                         

  • Introducción.
  • Fisiología del segmento faringo-esofágico.
  • Reconstrucción quirúrgica de la faringe.
  • Voz susurrada.
  • Métodos de aprendizaje.
  • Valoración de la voz esofágica.

                                          

     INTRODUCCIÓN.

   Tras la laringectomía total, el paciente se enfrenta a una nueva situación fisiológica condicionada por la extracción de la laringe lo que conlleva una desconexión entre el aparato respiratorio y el digestivo, pasando el aire directamente a la traquea a través de la cánula de traqueotomía. Las primeras sensaciones que experimenta el paciente son la falta subjetiva de aire y la ausencia de fonación, ambas influyen negativamente en la primera percepción del laringectomizado ante su nuevo tipo de vida.

   Para la mayoría de los autores el método fonatorio sustitutivo de elección tras la laringectomía total es el aprendizaje de la voz erigmofónica utilizando el esófago y la hipofaringe.

    En 1908 Hermann Gutzmann, profesor de foniatría de Berlín, estudia por qué y cómo se produce la voz esofágica y elabora un método para su desarrollo en pacientes laringectomizados.

   El término “voz esofágica” fue acuñado por Seeman en 1910 y posteriormente Escat en 1921 la denominaría “voz erigmofónica”. Steffen ( 1982) considera que la voz esofágica se produce mediante el mecanismo de eructo voluntario controlado; el aire es deglutido, y en un movimiento de peristaltismo reverso es expelido, pasando a través del efecto esfínter del constrictor medio e inferior de la faringe que constituye una verdadera glotis vibratoria.

   Si bien clásicamente se conoce como voz esofágica su nombre correcto es voz oroesofágica.

   Requiere de un aprendizaje y plantea varios problemas: no todos los pacientes laringectomizados consiguen desarrollar una voz esofágica óptima o, al menos, aceptable, otros no tienen acceso a su enseñanza y algunos no consiguen desarrollarla de ninguna forma. Las estadísticas internacionales con muchos años de valoración cifran en un 67% los buenos resultados fonatorios. Al esfuerzo de aprendizaje se le suma en algunas ocasiones la desesperación de no ver cumplidos los objetivos, pues sólo logran emitir una voz que aunque es útil, posee un tiempo de fonación muy corto y una intensidad reducida, que en ocasiones es tan pobre que no es inteligible aún en ambientes desprovistos de ruido.

   Los resultados que a veces se presentan estadísticamente como buenos no lo son tanto y es que la voz esofágica puede ser excelente, aceptable o pobre. No obstante puede ser que la voz no sea suficiente para una serie de actividades pero si para otras.

   El aprendizaje de la voz esofágica puede encontrarse con ciertas dificultades: estenosis, fístulas, fibrosis, limitaciones intelectuales y escasa habilidad. Ahora bien, sin duda, la causa más importante de los fracasos y de que se no se ponga en práctica las veces que debiese, es la falta de personal adiestrado para impartir la enseñanza de esta técnica.   No se ha de confundir la voz esofágica con la ventriloquia. La ventriloquia es pura habilidad de ilusionista y su denominación es un truco semántico: hablar con el vientre o con el estómago; no es más que la habilidad de modificar la voz producida por las cuerdas vocales, reducir al mínimo la gesticulación de la boca y labios, y sustituir los fonemas que requieren movimiento visible por otros que no lo necesitan haciendo que éste sea muy discreto o casi imperceptible. El elemento fonador del ventrílocuo, por tanto, es, ni más ni menos, el complejo sistema de los pulmones, la laringe, la faringe, y todo el conjunto articulador (lengua, dientes, paladar, labios) y resonador (cavidad buco-nasal) de la voz.

    La enseñanza de la voz esofágica se basa en tres principios básicos:

   1. Individualizar el flujo bucal del estómago, para conseguir succionar mayores flujos de aire a la hipofarínge y esófago, además de evitar el ruido que origina la turbulencia de aire en el estoma traqueal.

   2. La succión o deglución de aire hacia la hipofarínge y primer segmento esofágico, no llegando al estómago.

   3. La erupción automática fluida o en su defecto la eructación voluntaria de aire desde el esófago e hipofaringe hacia la cavidad oral.

    La introducción de las técnicas fonatorias de  fistuloplastias traqueomucosas y colocación de prótesis fonatorias de silicona abrió el debate entre fístulas-voz esofágica. Con las fístulas+PF muchos pacientes han conseguido una mejor calidad de su voz, aunque existen controversias en cuanto a la utilización de éste procedimiento debido a las complicaciones que surgen: necesidad del uso de antifúngicos para evitar la colonización de Cándida Albicans en la estructura de silicona de la prótesis, dependencia médica y costes que en muchos casos son asumidos por el paciente. En cualquier caso, las fistuloplastias y las PF tienen la ventaja de que el flujo de aire utilizado en la producción vocal sigue proviniendo de los pulmones, pues el paciente deriva el aire desde la tráquea hasta la faringe a través de la fístula, previa oclusión del traqueostoma y de ésta manera consigue un flujo más constante, mayores tiempos fonatorios, una voz más audible y menor fonastenia.

                  

              

   FISIOLOGÍA DEL SEGMENTO FARINGOESOFÁGICO.

   Las diferencias existentes entre la voz esofágica y la obtenida mediante la creación de una fístula traqueoesofágica son sólo, en principio, debidas al sistema efector. En la voz erigmofónica actúa como reservorio de aire efector el esófago, mientras que en la voz generada por fístula se utiliza el sistema pulmonar como elemento productor de flujo de aire.

   En relación al elemento vibrador no existe diferencia alguna, tanto la voz vicariante esofágica como la obtenida mediante las modernas técnicas de fistuloplastia se basan en la capacidad de generación de sonido por la vibración de un pliegue de la mucosa del segmento faringoesofágico. Es éste un tramo funcional común para ambas formas de sustitución vocal. Es por eso que los aspectos morfológicos y funcionales y de igual forma las desviaciones del patrón normal de funcionamiento son proyectables sobre los dos métodos de sustitución vocal.

    Segmento faringoesofágico.

   El segmento faringoesofágico constituye la región clave en cuanto a la producción vocal después de la laringectomía total. En el sujeto normal se define como segmento faringoesofágico la región de transición entre hipofaringe y esófago cervical que está limitada, según Killiam (1908), por delante, por la mitad inferior de la lámina cricoidea, sobre la que se apoya la pared faringoesofágica; por detrás y lateralmente está formada por las fibras inferiores del constrictor inferior de la faringe y el músculo cricofaríngeo. Presupone esta descripción una dimensión en sentido craneocaudal de aproximadamente 17cm. Como subraya Mounier-Kuhn, la aseveración que hizo Killiam en 1908, que negaba la existencia de un límite anatómico entre la faringe y el esófago, marca un punto de partida para numerosos estudios anatómicos de ésta región que coinciden en su mayoría en reconocer una individualidad anatómica a este nivel, individualidad que genera, a juicio de Testut y Pellenda, el estrechamiento más constante y acusado de los que presenta el esófago, hecho mencionado posteriormente en la era de comienzos de la endoscopia por el mismo Killiam y confirmado por Jackson en la descripción que hace de las dificultades del paso del endoscopio por esta zona.

   Esta diferenciación anatómica y funcional, configurada tanto morfológicamente como desde el punto de vista fisiológico por la presencia del músculo cricofaríngeo y margen caudal del constrictor inferior de la faringe principalmente, desaparece en gran medida con la exéresis de la laringe.

   En el paciente laringectomizado, la implicación del músculo cricofaríngeo en la fisiología fonatoria del segmento faringoesofágico es prácticamente nula, pues éste queda denervado y desinsertado de las estructuras cartilaginosas de la larínge tras la cirugía. Según Raymond A. Daou et al. 1984, la longitud de la neoglotis viene definida por la altura que señala la unión entre la pared hipofaríngea anterior y la prominencia retrofaríngea, estando ambas estructuras compuestas por mucosa redundante que ante la vibración originada por el paso de aire (flujo ascendente) toman parte como elemento vibrador de la voz esofágica. En un trabajo realizado con pacientes portadores de prótesis fonatoria, Miki saito et al. 2000, observan como la prominencia retrofaríngea (según éstos autores compuesta mayoritariamente por músculo tirofaríngeo), contacta con la pared anterior del segmento faringoesofágico, siendo la superficie de contacto (neoglotis) de 35 mm de altura media. El análisis fibroscópico pone de manifiesto como el contacto entre la prominencia retrofaríngea y la pared anterior no es un fenómeno pasivo, pues la neoglotis se cierra ante los esfuerzos fonatorios insonoros y se abre con la fonación audible, como si se tratase de un esfínter muscular. Esta propiedad de esfínter neoglótico, de difícil explicación fisiológica (pues teóricamente la musculatura a ese nivel ha sido denervada), la vemos constantemente en el examen con fibroscopio flexible de los pacientes laringectomizados que hablan con voz esofágica.

                                             

                                                    

     RECONSTRUCCIÓN QUIRÚRGICA DE LA FARINGE.

   El tipo de reconstrucción del segmento faringoesofágico influye en gran medida en la posterior funcionalidad desde el punto de vista de la generación de sonido. Cuantos menos planos de tejidos se interpongan y menor tensión se aplique, mayores probabilidades existirán de obtener una voz esofágica óptima.

   La conservación de un segmento de pericondrio de unos 15mm. de anchura, como se describe en la realización del corsé de Tapia, obtenido del lugar de inserción del constrictor inferior de la faringe y vinculado a éste músculo, ofrece por medio de la sutura con el lado opuesto una protección y refuerzo del cierre faríngeo suficiente. Esto deja una zona media anterior recubierta por pericondrio que evita la aproximación íntima entre ambos márgenes anteriores de la musculatura constrictora aunque manteniendo la conexión entre ambos músculos entre sí y con el aspecto lateral de la faringe en ambos lados. Con ello, se reduce la posibilidad de una tensión extrema a este nivel, por otro lado se conserva la presencia de la musculatura constrictora y la normal relación con el músculo estilofaríngeo que imbricado con aquélla mantiene su distribución en la pared lateral de la faringe.   Respecto al músculo cricofaríngeo la actitud más aceptada es la que lo mantiene en el lugar en el que, por retracción después de la resección, se sitúa, pues no aporta ningún beneficio desde el punto de vista de seguridad en el cierre y presupone un mayor aporte de masa muscular contráctil sobre el segmento en el que deseamos obtener la mayor elasticidad posible y un moderado tono muscular de cierre.

                                        

                                           

     VOZ SUSURRADA.

   En el período postoperatorio el paciente no tiene más remedio que recurrir a la escritura utilizando la mayoría de las veces una pizarrita. A la vez puede llegar de forma espontánea, y sin ayuda, a realizar una voz susurrada, algo particular, resultado de la interacción de los movimientos naturales de los órganos de la articulación del habla (labios, lengua, velo del paladar y mandíbula) con el aire de la boca y de la cavidad orofaríngea. Gracias a esta voz susurrada, el laringectomizado llega a  hacerse comprender de forma más o menos eficaz en la medida que el entorno colabora. Hace unas décadas se prohibía al laringectomizado realizar esta voz susurrada, creyendo que esta prohibición le incitaría a adquirir y perfeccionar la voz esofágica. También se incriminaba a esta voz el ser la responsable de conductas fonatorias defectuosas como la llamada voz de rana. En la actualidad se admite que la voz susurrada no presenta inconveniente si se  indica al paciente que puede realizarla sin hacer ningún esfuerzo articulatorio y que recurra a la escritura en caso de no ser comprendido.   El esfuerzo articulatorio presenta el riesgo de generar tres defectos importantes en la emisión vocal: la emisión de aire traqueal, el silabeo y la voz de rana. Es importante evitar la estructuración de estos defectos postoperatorios en hábitos que después serán difíciles de abandonar.

   La emisión de aire traqueal durante los intentos de habla es el resultado del hábito normal preoperatorio de utilizar el aire de los pulmones para hablar. Cuando el aire se escapa por el traqueostoma, el individuo entra en una dinámica de esfuerzo tan ineficaz como intempestiva. En efecto, el soplo traqueal presenta un doble inconveniente: la intensidad de la voz susurrada es limitada, y queda enmascarada por el ruido producido por el aire de la traquea; en segundo lugar, hace que el habla sea fatigosa. Debido a la falta de resistencia glótica, el paciente se encuentra de forma constante ante una situación parecida a la de alguien que se agota por querer abrir una puerta que está abierta. La pérdida de soplo conlleva una disminución de la tasa de gas carbónico en sangre que puede comportar una sensación de laxitud con fenómenos de pseudovértigo-mareo y pérdida de las ganas de hablar.

   El silabeo es el resultado de intentar hacer inteligible el habla articulando cada sílaba de cada palabra. Al contrario, este procedimiento, lejos de aumentar la inteligibilidad, la disminuye. Una palabra cortada en pedazos es una palabra muerta. La vivacidad del habla exige que el ritmo  natural de las palabras esté conservado.

   La voz de rana es el resultado en la mayoría de las ocasiones del paso comprimido del aire faríngeo entre la base de la lengua y la pared posterior de la faringe. Excepcionalmente puede tratarse de un ruido producido por el aire acumulado en una mejilla y empujado con fuerza a través de los arcos dentarios hacia la cavidad bucal. Aunque la voz de rana hace el habla más inteligible, el timbre de esta voz, que recuerda el croar de las ranas, es muy antiestético. Además las contracciones bucofaríngeas que se requieren par producir esta voz hacen difícil la posterior adquisición de una voz esofágica.

    Principios básicos de la erigmofonía.

   La erigmofonía requiere un aprendizaje más o menos arduo que requiere de frecuentes explicaciones para que el paciente comprenda el mecanismo de toma y expulsión del aire para generar voz mediante el segmento faringoesofágico. Por tanto, lo primero que precisa el paciente es tener acceso al personal rehabilitador adecuado.

   Para poder entender el mecanismo de la voz erigmofónica o esofágica es indispensable contar con una metodología que abarque la problemática desde una visión lo más amplia posible en cuanto a la medición o el cálculo de los parámetros implicados en el desarrollo de este tipo de voz. Así pues, se debe estudiar la función pulmonar mediante espirometría, la dinámica del segmento faringoesofágico en cuanto a la presión neoglótica, flujo fonatorio y tiempo de fonación se refiere realizando el análisis aerodinámico fonatorio, y el producto vocal mediante análisis acústico y perceptual.   En algunos casos se realizarán pruebas más invasivas como la fibrolaringoscopia indirecta o la manometría faringoesofágica para explicar y validar algunos fenómenos fisiológicos que se registran con las pruebas rutinarias que se han de realizar a todos los pacientes.   Hoy se dispone de la tecnología suficiente (a veces sumamente simple) para abordar la fisiología del segmento faringoesofágico desde múltiples puntos de vista, pues los distintos parámetros estudiados aunque algunas veces se manifestarán en forma de datos aislados, otras darán luz de forma parcial al entendimiento de un problema concreto, pero no en pocas ocasiones serán la pieza clave en el conocimiento de la fisiología de la voz esofágica.

  Tres son los mecanismos básicos que precisa adquirir y dominar el laringectomizado para efectuar un correcto aprendizaje:

   1. Lograr la independencia de los soplos bucal y pulmonar.

   2. Conseguir una inyección, succión o deglución del aire, lo más correctas y conscientes posibles, en el esófago.

   3. Producir una erupción automática fluida, o en su defecto una eructación voluntaria.

    Conseguir la independencia de soplos, traqueal y bucal, no es fácil pues supone romper un automatismo profundamente arraigado desde el nacimiento hasta la laringectomía, porque siempre se habla, se grita, se canta o se emite cualquier sonido fonatorio en relación con la espiración. El soplo de tipo inspiratorio es poco frecuente y excepcional.

   La escasa intensidad sonora o el bajo volumen sonoro de la voz esofágica se apaga aún más si su emisión se produce al mismo que se expulsa el aire pulmonar a través del estoma traqueal. Es un defecto que hay que evitar a todo trance y por ello es tan importante que, especialmente al comienzo de la rehabilitación, el paciente se ajuste a las instrucciones del rehabilitador y deje de hacer ensayos por su cuenta.

   El segundo mecanismo, que consiste en la introducción de aire en el esófago, es tan o más importante que el primero. Al explicar más abajo los diferentes métodos de rehabilitación veremos que una diferencia fundamental entre ellos es la forma de introducción del aire en el esófago. De todos ellos el método de la deglución es el más fácil e instintivo por el aprendizaje alimentario.

   En tercer mecanismo es el logro de una eructación automática, como consecuencia de un correcto mecanismo de toma de aire por la boca esofágica.

                                           

   MÉTODO.

   Para llegar a producir voz oroesofágica el principio esencial consiste en introducir aire en el esófago, por vía bucal, de manera que pueda ser utilizado para sonorizar el habla.   En la voz oroesofágica, el tiempo activo es de entrada de aire. El tiempo propiamente fonatorio que se corresponde con la salida del aire es más bien pasivo. El paciente debe de aprender a que se produzcan los eructos. Esto supone un cierto problema porque es el mecanismo inverso al que tiene lugar en la voz laríngea, en la que el sujeto inspira sin esfuerzo y moviliza una cierta energía en el momento de la fonación.

   Posiblemente sea ésta una de las razones que hacen más difícil el aprendizaje de la voz esofágica. Otra razón es que la emisión de eructos es considerada como una conducta inadecuada y genera una inhibición de origen social.   Hay que añadir dos objetivos importantes al principio de emisión controlada de eructos. Primero, la adquisición de voz esofágica con independencia de los soplos traqueales: el individuo debe a prender a evitar la utilización del soplo traqueal durante la fonación. El otro objetivo es la preservación de las consonantes, que tiene riesgo de perder su concreción, a causa del esfuerzo.

   El aprendizaje, según el método a utilizar, puede realizarse en régimen de internado en un centro especializado o mediante un régimen de consultas externa.

   Se recomienda iniciar la reeducación lo antes posible, es decir a partir de lo 15-20 días posteriores a la intervención. Esto permite evitar la aparición de malos hábitos como el susurro o la voz de rana y llegar con mayor rapidez a un mejor resultado. De hecho puede comenzarse en cuanto se retira la sonda nasogástrica.

   En un principio conviene no precipitarse, pues son necesarias varias semanas para retablecerse psicológicamente de una intervención tan agresiva. Además, como ya se ha indicado, el período de radioterapia que la mayoría de los casos sigue a la intervención no es el más adecuado a causa de las reacciones inflamatorias que la misma produce.   En la práctica transcurre un cierto lapso de tiempo entre la intervención y el inicio real de la reeducación.

    Conseguir una voz esofágica puede ser una empresa muy difícil por lo que existen diferentes métodos de rehabilitación de la voz esofágica. Estos métodos se diferencian entre ellos por la forma de responder a los diferentes problemas que plantea la adquisición de esta técnica y que se acaban de exponer. No es necesario utilizar sólo una de estas técnicas, sino que se puede recurrir a más de una.

                      

    Método de deglución o método clásico.

   Descrito por Gutmann en 1909, es el método más fácil e instintivo.

   Este método se apoya en la utilización de la deglución como medio para descubrir la mecánica de la emisión de eructos, por tanto consiste en introducir el aire en la faringe-esófago mediante movimientos de deglución. La técnica consiste en deglutir el aire, y cuando se percibe su introducción en el esófago, expulsarlo emitiendo una vocal. La deglución deberá ser incompleta para que el aire no llegue al estómago.

   Al principio se propone al paciente que degluta agua con gas, lo que permite que se familiarice con el eructo espontáneo. Luego se le propone comenzar a deglutir directamente aire pidiéndole que intente expulsarlo inmediatamente siguiendo la norma de trague-eructe, para ello puede ayudarse de la contracción de la musculatura abdominal.

   En la mayoría de los casos la emisión de eructos no se produce hasta después de un cierto tiempo, incluso varios minutos después de inyectar aire en el esófago por medio de la deglución. Sin embargo, lentamente, le emisión de eructos tiende a ser inmediata. Pueden utilizarse maniobras de descenso de la lengua con un depresor para desencadenar el efecto de forma refleja.

   Al principio, al deglutir el aire tiende a bajar hasta el estómago provocando trastornos gástricos, meteorismo y un verdadero eructo; es decir, un ruido poco estético y poco adaptable a los fonemas. Aunque con el ejercicio la dificultad se va atenuando, con ésta técnica la palabra tiene poca fluidez y está sujeta a continuas interrupciones por las tomas de aire reiterativas.

   Los sorbos de agua, con gas o sin ella, deben suprimirse pronto, en cuanto el paciente aprenda a manejarse en la toma y expulsión de aire, sin que pase al estómago, pues, aparte de las molestias gástricas, el ruido producido es lento, débil y mal regulable, aparte de la halitosis que se puede presentar cuando hay fermentación gástrica.

   Cuando el paciente ha adquirido el control del eructo de forma voluntaria, se le propone que produzca una vocal más o menos prolongada en cada eructo, luego vocales sucesivas, luego palabras de una sílaba, más tarde palabras de dos o tres sílabas, hasta llegar a frases cortas, y progresivamente a la conversación.

   El paciente con este método debe aprender a deglutir volúmenes relativamente importantes y a expulsar el aire de forma económica, para deglutir aire más a menudo y evitar la fragmentación del habla.

   En la mayoría de los paciente este método se considera como el mejor para iniciar el aprendizaje y posteriormente utilizar otra técnica, como la de engullir. Se considera que es el método más fácil e instintivo por el aprendizaje alimentario. Es preciso recordar que la deglución es un acto reflejo muy complicado y además excesivamente largo si se compara con la rapidez de los movimientos articulatorios de la fonación con los que se va a relacionar en la erigmofonía.

   Esta es la causa fundamental por la que el método de la deglución es el más pobre, ya que, aparte de los inconvenientes de este tipo de ingreso de aire, está la pobre fluidez de la palabra lograda, pues cada tres o cuatro sílabas hay que interrumpir la articulación para deglutir un nuevo acopio de aire.

   Tiene la ventaja de su simplicidad teórica pues tragar aire y eructar son cosas que se comprenden fácilmente.

   La principal desventaja del método es la lentitud del habla, pues cada emisión de sonido es interrumpido para posteriormente volver a realizar una deglución. Por otra parte, en este método resulta difícil lograr una independencia de flujo estomático traqueal, con el consiguiente ruido a nivel del estoma.

                       

   Método de aspiración o método Seeman.

   También se le conoce como método de inhalación o de succión ya que la técnica de deglutir es remplazada por la engullir. Los métodos de aspiración y de inyección de aire, descritos por Seeman (1922), consisten en introducir el aire dentro del esófago por medio de un movimiento de succión forzada.

   Consiste en hacer entrar pequeñas cantidades de aire en el esófago esforzándole en crean una zona de baja presión que lo haga entrar con facilidad por disminución de la presión en la caja torácica. La presión pleural es equivalente a la presión intraesofágica, razón por la cual resulta más eficaz comenzar la introducción del aire con una inspiración profunda, facilitando así el gradiente de presiones entre el aire atmosférico e intraesofágico, facilitando la entrada de flujo de aire hacia el esófago. El método de aspiración exige un mayor control muscular que el de deglución y por lo tanto es más difícil.

   Los primeros intentos de engullir se realizan con la boca entreabierta y la mandíbula ligeramente rígida mediante un pequeño movimiento del mentón hacia delante y una ligera dilatación del cuello. Da la sensación de que es toda la garganta la que se dilata para engullir aire. La abertura de la boca esofágica comporta un pequeño chasquido. Se añade a este movimiento de engullir en la boca y la orofaringe un breve movimiento inspiratorio por dilatación abdominal (inspiración abdominal). Con este gesto se produce un descenso brusco del diafragma que contribuye a la entrada de aire en el esófago.   Además de sustituir la deglución del aire por el engullido, el desarrollo del aprendizaje es calcado al del método clásico anterior, con la misma preocupación por obtener poco a poco el mayor número posible de sílabas con un único engullido.

                                   

    Método de inyección.

   También llamado método Holandés, fue descrito por Moolenaar-Bil (1953) y P.H. Damsté (1957).

   Este método nació de las observaciones del paciente laringectomizado J. Winter, que constató una mayor facilidad para producir palabras que empezaban por determinadas consonantes. Consiste en la ejecución de dos técnicas, la inyección por presión glosofaríngea y la acción inyectante del movimiento articulatorio de las consonantes explosivas y sibilantes sordas. Este método orienta el aprendizaje desde el principio a la utilización de consonantes inyectantes. De esta forma, las primeras producciones vocales no son vocales aisladas, sino sílabas que empiecen por consonantes inyectantes, por ser sonidos que producen mayor turbulencia y presión de aire. (pa, pe, pi, ta, ka, fa, sa, cha, etc)   En la inyección por presión glosofaríngea la lengua funciona como un pistón, comprimiendo e inyectando el aire en el esófago con un movimiento fuerte y rápido. No se propone al paciente que llene abundantemente el esófago de aire. El problema ya no consisten en producir el mayor número posible de sílabas con una única introducción de aire, sino por el contrario, consiste en encontrar la forma de inyectar el esófago discretamente con el objetivo de perturbar lo menos posible el ritmo del habla. Como es el mismo movimiento articulatorio el que se encarga de la entrada de aire en el esófago, la inyección puede ser más frecuente y no ser voluminosa.

   El procedimiento consiste en colocar los labios bien apretados, la lengua contra el paladar duro y el velo del paladar blando cerrando el cavum; entonces la lengua se eleva con fuerza y se retrae hacia atrás para comprimir el aire en la cavidad faríngea e inyectarlo a través de la boca esofágica. La compresión del aire es ayudada por la contracción de los músculos del cuello, elevando la región esofágica del esfínter hacia la boca en un movimiento muy parecido al de la articulación de los fenómenos oclusivos /p/, /t/ y /k/. Los autores holandeses están convencidos de que es el mejor método, porque es el que da mayor fluidez a la palabra, máxima intensidad de la voz en erigmofonía, no se acompaña de ruido de aire del traqueostoma y no contraría las funciones pulmonares. Permite disponer siempre de aire suficiente (ni demasiado, ni poco) sin interrupciones articulatorias ni golpes por la deglución del aire o por la expulsión espiratoria traqueal, y sobre todo, tanto la inyección como la succión, provocan una relajación del esfínter esofágico que permite el paso de aire sin esfuerzo alguno, mientras que en la deglución la contracción de la base de la lengua sobre la hipofaringe hace entrar en contracción e hipertonía al cricofaríngeo.

   Desde el comienzo se incita al individuo a utilizar el movimiento del habla para asegurar la entrada de aire en el esófago, produciéndose entonces, y sin esfuerzo alguno para eructar vocales automáticamente. La falta de esfuerzo es la característica principal de cualquier paciente que hable bien, independientemente del método que haya utilizado para aprender. El método holandés incita a un aprendizaje con suavidad y con gestos comedidos en lugar de producir eructos de forma voluntaria y a la mayor velocidad posible.

   El método utilizado en cada caso depende exclusivamente de la facilidad del paciente para aprender uno u otro. En cualquier caso, aquellos que consiguen una VE óptima utilizan una técnica mixta. Una buena fonación esofágica requiera: fonación voluntaria, pequeña latencia entre la entrada de aire y la fonación, duración adecuada de la fonación y fonación encadenada durante el habla.

                                      

     Método del bloqueo.

   Fue creado por la escuela de Marsella en 1970. Este método nació probablemente del deseo de obtener, en primer lugar, una emisión voluntaria de eructos. Durante la primera parte de este método el paciente está varias semanas pensionado en un centro especializado. Se comprende la necesidad de dar al paciente recién operado durante su estancia, al menos, unas nociones mínimas del mecanismo básico de la voz oroesofágica, es decir, la emisión controlada de eructos, con la idea de que si se ha obtenido esto quizás podrá adquirir el resto por sí mismo.

   Los bloqueos son el resultado de movimientos que actúan creando una compresión del aire en la orofaringe, sin intención alguna de deglutir o de articular una sílaba o una palabra. La técnica del bloqueo es menos discreta que la de las consonantes inyectadas, ya que utiliza un movimiento que, al igual que el de deglución, se añade a los del habla. Cuando se trata de pronunciar vocales aisladas o palabras que no empiezan con consonantes inyectantes, este movimiento añadido es indispensable.

   Al comenzar el aprendizaje de este método el primer objetivo es la obtención de vocales y se pide al paciente cierta energía para producir las inyecciones y los eructos, lo que excluya, al menos al principio, la obtención de vocales automáticas. Puede proponerse eventualmente una etapa de silabeo.

    Estos métodos se diferencian por la diferente manera que proponen para proveer al esófago del aire necesario. Para ello se puede empujar el aire por abajo o llevar el aire por encima. En segundo lugar se diferencian por lo objetivos prioritarios que proponer. Una forma de actuar se halla condicionado por el hecho de querer obtener de la manera más rápida posible eructos voluntarios y su utilización en el habla, creyendo que si aparecen algunos defectos se corregirán más tarde. Es más aconsejable actuar más suavemente, lo que significa ir más despacio, y de esta forma adquirir un control más ordenado y consciente de los mecanismos del habla con VE.

                                                  

                                                     

     VALORACIÓN INSTRUMENTAL DE LA VOZ ESOFÁGICA.

   Para valorar la excelencia de una voz erigmofónica, ésta ha de acercarse lo máximo a estos parámetros:

   -  La fonación resultante ha de ser inmediata a la demanda.

   -  Para producir la fonación la absorción de aire ha de ser muy rápida, para que el tiempo de latencia entre la absorción y la fonación sea muy corto.

   -  Por cada toma de aire se ha de producir por lo menos de cuatro a nueve sílabas, o lo que es lo mismo se pueda hablar dos o tres segundos.

   -  Que las palabras por minuto lleguen a ser entre 80 y 100.Que la frecuencia fundamental se mantenga entre 52 y 80 herzios. Y que la intensidad media no sea inferior a los 15-18 dB sobre la voz normal.

   Además de esta valoración clínica que normalmente es más que suficiente se puede realizar un análisis instrumental mediante estos métodos:

   Análisis acústico.

   La mayor parte de los trabajos publicados en la literatura médica sobre el análisis acústico de la voz erigmofónica hacen referencia a la producción vocal del laringectomizado mediante prótesis fonatorias más que a la voz erigmofónica. Algunas series estudian las diferencias observadas entre la VE con y sin prótesis fonatorias, haciendo referencia a los parámetros acústicos analizados en el grupo de pacientes a los que este capítulo se refiere, es decir, los que hablan con VE.

   Respecto al análisis espectrográfico de la voz esofágica, hay trabajos en la literatura médica que señalan una tendencia a que la energía se concentre en todas las frecuencias y no en áreas específicas como en los sujetos con laringe. El ruido, es un componente constante que “ensucia” el trazado espectrográfico concentrándose fundamentalmente en las frecuencias más altas. No se han encontrado trabajos que clasifiquen la voz esofágica atendiendo a la clasificación espectrográfica de Yanagihara.

   Son muchos los trabajos de investigación que ponen de manifiesto una mayor inteligibilidad en la voz de los pacientes laringectomizados con prótesis fonatoria que en aquellos que no la usan. Las diferencias mas importante entre la voz esofágica con y sin PF son el speech rate (nº de sílabas / tiempo de fonación (s), el tiempo de fonación y la intensidad del habla. Las tres variables se relacionan con la inteligibilidad y están reducidas en el habla esofágica debido a la ausencia del elemento efector pulmonar, lo que ocasiona una voz entrecortada y pausada en el laringectomizado con VE.

    En la VE, se aconseja como medida rehabilitadora, que éstos pacientes incrementen la F0 durante los estadios iniciales de la rehabilitación, debido a que hay una correlación entre dichos parámetros y el análisis perceptual de la voz.

   Análisis aerodinámico.

   Los valores aerodinámicos que se emplean para evaluar la voz, pueden utilizarse para la voz esofágica, después de una laringectomía total. Las mediciones aerodinámicas en estos casos han recibido mayor atención desde la introducción de las PF. El origen de la voz continúa siendo el segmento faringoesofágico. La aerodinámica fonatoria de los pacientes laringectomizados con fístula traqueoesofágica respecto a los que no la tienen difiere considerablemente; los pacientes sin fístula sólo disponen de una pequeña cantidad de aire para la fonación, de forma que solo pueden producir frases cortas (tiempo de fonación corto) y precisan introducir aire constantemente en el esófago, mientras que los pacientes laringectomizados que emplean una prótesis fonatoria para la producción de su voz esofágica son capaces de utilizar la mayor parte del aire disponible en los pulmones.

   Los parámetros aerodinámicos que más información aportan en el paciente laringectomizado son la presión neogótica y el flujo fonatorio. Se ha podido comprobar que las variaciones (por defecto o por exceso) o patrones determinados de las variables aerodinámicas, influyen positiva o negativamente en la inteligibilidad de la voz erigmofónica.

   Harm K. Schutte et al. 2002 en un estudio llevado a cabo en 18 pacientes con PF (Gröningen) y 7 pacientes con VE, calculan los parámetros anteriormente señalados utilizando una máscara de Rothenberg y midiendo los valores aerodinámicos resultantes de la fonación sostenida de una /a/ y una /i/. Los resultados de dicho estudio concluyen que los pacientes con PF tienen unos valores de Pneo y FF mayores que aquellos con VE. El resultado de dicho estudio concuerda con otros autores como Vuyk‘s et al. 1985, señalando que la mayor inteligibilidad de la voz con PF precisamente se debe a que los valores aerodinámicos son más altos y más estables durante la fonación que en la VE.

   Sin embargo, Jeffrey P. Searl en un estudio realizado en el 2002 llegan a la conclusión (comparando un grupo de pacientes con PF versus VL) que la incapacidad para “modular” el valor de la presión neoglótica durante una fonación con diferentes fonemas, es la causa principal de la baja inteligibilidad que presentan algunos pacientes con PF, determinando que el valor de la presión neoglótica debe tenerse en cuenta a la hora de rehabilitar a los pacientes con PF, y por extensión a los de VE. En este estudio los pacientes con PF obtienen valores medios y variabilidad de la presión neoglótica mayores que en el grupo control (VL). El pico de la presión neoglótica se mantiene estable en la VL al repetir el mismo estímulo (fonema). El uso de esta medida como medio para evaluar la estabilidad de la VE ha sido sugerido por Murió T, concluyendo que las variaciones del “pico” de presión neoglótica podrían servir como índice de estabilidad en la producción vocal, no sólo con fines de investigación, sino también rehabilitadotes. En este sentido, Connor et al. 1985, utilizan los valores de la presión neoglótica como terapia de biofeedback para mejorar la inteligibilidad de los pacientes laringectomizados.