De las notas a las vocales: Correlaciones neuronales entre el entrenamiento musical y el procesamiento del habla

Tanto el entrenamiento musical vocal como el instrumental exigen un procesamiento auditivo significativo para resolver los diminutos cambios de timbre, tiempo y tono tanto de las notas individuales como de su organización sintáctica superior en melodías. Distinguir los timbres—las complejas propiedades acústicas espectrales y temporales que permiten diferenciar los instrumentos que tocan la misma nota—es crucial y desafiante en arreglos complejos como una orquesta completa. Asimismo, es esencial establecer una sincronización precisa a través de una conciencia aguda de los cambios temporales, como el inicio y el desplazamiento de las notas que guían el ritmo y el tempo musical. Por último, la percepción aguda del tono es importante para ordenar las notas como relativamente más altas o más bajas en frecuencia. Una desviación aproximada del 6% en la frecuencia corresponde a un semitono musical que, para los músicos occidentales, puede significar la diferencia entre tocar dentro o fuera de tono. En un violín, por ejemplo, un semitono corresponde a un espacio físico del orden de milímetros, por lo que se requiere tanto una fina discriminación del tono como una excelente coordinación sensomotora. Estas habilidades son especialmente evidentes en técnicas como el vibrato, donde los movimientos periódicos crean fluctuaciones controladas en la afinación de una sola nota.

A través de la repetición frecuente, los músicos desarrollan una mayor capacidad de percepción auditiva que se asocia con cambios estructurales y neurofisiológicos dependientes de la experiencia en la respuesta del cerebro al sonido. Por ejemplo, la duración del entrenamiento de piano se correlaciona con la fuerza de la activación neural por las notas de piano, lo que indica representaciones corticales más fuertes de estos estímulos entrenados (Pantev et al., 1998). Más recientemente, Hyde et al. (2009) correlacionaron tan sólo 15 meses de entrenamiento musical instrumental con cambios cerebrales estructurales en áreas motoras y auditivas que fueron paralelos a las mejoras conductuales en pruebas musicales motoras y auditivas. Además, estos beneficios conductuales pueden generalizarse a otras formas de procesamiento acústico complejo, como el habla (Parbery-Clark et al., 2009), que comparte muchas claves espectrotemporales con la percepción musical. Por ejemplo, los armónicos vocales que definen el timbre pueden desambiguar las voces de varios hablantes, las pequeñas diferencias temporales en el inicio de la voz pueden indicar distinciones fonéticas, y los contornos del tono son importantes para discernir preguntas y declaraciones, así como el significado fonológico en los idiomas tonales. Podría decirse que la transferencia de la competencia musical al procesamiento del habla es el resultado de las mayores exigencias que el entrenamiento musical impone a cada una de estas señales acústicas (Patel, 2014).

Al medir de forma no invasiva los potenciales cerebrales relacionados con eventos (ERPs) a través del EEG registrado en el cuero cabelludo, los investigadores han demostrado latencias de inicio neural más cortas y una codificación cortical (Schön et al., 2004) y subcortical (Wong et al., 2007) más sólida del habla en los músicos en comparación con sus compañeros no músicos. Esto es válido tanto para la experiencia musical vocal como para la instrumental, y sugiere que los mecanismos de neuroplasticidad vinculados al entrenamiento musical pueden beneficiar el procesamiento del habla y del lenguaje a través de sus redes de procesamiento auditivo compartidas.

Estudios anteriores de Bidelman et al. utilizaron una tarea de percepción de fonemas categóricos para investigar las mejoras neuronales de dominio cruzado en músicos jóvenes (Bidelman et al., 2014a) y los déficits neuronales relacionados con la edad en los no músicos (Bidelman et al., 2014b). Otro trabajo reciente ha informado de la mejora de las respuestas auditivas del tronco cerebral de músicos mayores con pérdida de audición que tenían un deterioro auditivo perceptivo significativamente menor (es decir, dificultad para oír en el ruido) en comparación con los no músicos con perfiles de audiograma emparejados (Parbery-Clark et al., 2013). Lo que quedaba por investigar era la resistencia del procesamiento auditivo en los músicos frente a los descensos relacionados con la edad en los potenciales evocados por la audición antes de los déficits conductuales del habla o la audición. Esta cuestión se abordó en Bidelman y Alain (2015) midiendo los potenciales auditivos evocados corticales y subcorticales en músicos sin pérdida de audición, la mayoría de los cuales tenían entre 60 y 70 años. El grupo de control estaba formado por adultos de edad similar con una sensibilidad auditiva normal y <2 años de entrenamiento musical formal en su vida.

Cuando se presentaron cinco sonidos vocálicos con variantes uniformemente espaciadas de su primera frecuencia de formantes, se instruyó a los sujetos para que categorizaran fonéticamente sus percepciones como /u/ o /a/. Los hallazgos clave de este estudio son que los músicos, en comparación con los no músicos, tenían (1) latencias de inicio neural aceleradas a nivel de la subcorteza y la corteza, (2) tiempos de reacción conductual más rápidos en el juicio fonémico, y (3) representaciones neurales más separables (medidas por P2 del ERP cortical) cuando se condicionan a las percepciones categóricas (Bidelman y Alain, 2015, su Fig. 5). Estos resultados apoyan una asociación entre el compromiso musical de toda la vida y la agudización resistente del procesamiento auditivo en los músicos mayores.

Al interpretar estos resultados, Bidelman y Alain (2015) postulan que los cambios neuroplásticos en las redes de procesamiento auditivo no están restringidos por la edad. Esto implica la posibilidad de que las intervenciones musicales tardías transfieran los beneficios al procesamiento del habla, tal vez incluso al inicio o cerca del inicio de los déficits medibles relacionados con la edad. Sin embargo, es importante señalar que los sujetos de este estudio comenzaron su entrenamiento musical antes de los 14 años, y es posible que el momento del inicio de este entrenamiento haya sido crítico para que se produzcan cambios neuroplásticos. Es decir, los cambios estructurales que subyacen a las respuestas diferenciales evocadas por la audición al final de la vida pueden haberse desarrollado tempranamente en el grupo de músicos y haber permanecido estables durante muchos años, resistiendo así la degradación relacionada con la edad en lugar de reestructurarse activamente en respuesta a los efectos deletéreos del envejecimiento.

Es posible abordar esta cuestión, quizás incluso dentro del conjunto de datos actual, investigando las diferencias individuales en el inicio y la amplitud de los ERPs y su correlación con el inicio y la duración del entrenamiento musical. Por ejemplo, una correlación sólida con la duración del compromiso musical podría proporcionar pruebas convincentes en apoyo de la neuroplasticidad continuada y dependiente de la experiencia, de modo que el compromiso musical continuado podría ser un determinante más fuerte de los potenciales evocados auditivos que la exposición musical temprana. En futuros estudios, la inclusión de individuos que comenzaron su formación musical más tarde en la vida, así como aquellos con formación temprana que se interrumpió en la adolescencia, proporcionaría una valiosa visión de esta cuestión (como en Skoe y Kraus, 2012). En conjunto, se podría determinar si el entrenamiento y la práctica temprana, reciente y/o sostenida es suficiente para una codificación auditiva robusta.

También es importante señalar que los resultados de Bidelman y Alain (2015) no indican necesariamente una causalidad entre la experiencia musical y la neuroplasticidad auditiva. Para reducir la posibilidad de que otros factores preexistentes influyan en las diferencias del grupo (por ejemplo, genéticos y ambientales), se han realizado estudios longitudinales, principalmente en niños pequeños (Fujioka et al., 2006; Moreno et al., 2009; Francois y Schön, 2011; Chobert et al., 2014). En un ejemplo, Moreno et al. (2009) informaron de una mayor codificación neural de los cambios de frecuencia en la escucha de música entre grupos de niños asignados aleatoriamente a una clase de música o a una clase de pintura durante 9 meses. Los beneficios fisiológicos y conductuales de tales programas de entrenamiento musical en niños, junto con las habilidades auditivas/de lenguaje más recientemente descritas en músicos adultos, sugieren que deberían realizarse estudios aleatorios similares en individuos de mayor edad para evaluar directamente el impacto de los programas de intervención musical continuados o tardíos.

Los mecanismos de la plasticidad auditiva impulsada por la música aún no se conocen bien, pero pueden implicar la modulación de la codificación del tronco cerebral a través de las proyecciones corticofugales descendentes. Esto se ve apoyado por la mejora selectiva de los rasgos acústicos portadores de información en los troncos cerebrales de los músicos, donde, por ejemplo, los armónicos superiores que normalmente conducen a las melodías tienen representaciones neuronales más fuertes en contraposición a los aumentos amplios de ganancia en todas las frecuencias (Lee et al., 2009; Kraus y Chandrasekaran, 2010). De hecho, la modulación corticofugal puede desempeñar un papel en la fuerte interacción grupal × vocal de las amplitudes corticales P3, ambas reportadas en Bidelman y Alain (2015) y ampliamente asociadas con la atención. Estos resultados sugieren una mayor reorientación auditiva en los músicos que, junto con los trabajos recientes que indican la modulación atencional incluso de la sensibilidad coclear (Delano et al. 2007), proporcionan apoyo a los modelos de bucles de retroalimentación capaces de modular las estructuras aferentes auditivas.

Otros mecanismos candidatos de plasticidad incluyen el mayor establecimiento y/o fortalecimiento de sinapsis a nivel del tronco cerebral para afinar el procesamiento sensorial ascendente. Por ejemplo, una mayor sincronización de fase de las neuronas con las formas de onda acústicas puede codificar una representación neural-acústica de mayor fidelidad a través de la plasticidad ascendente que, en última instancia, permite la entrega de una señal más comprensible a la corteza. En resumen, cabe señalar que la plasticidad puede estar teniendo lugar en múltiples escalas espaciales en las vías auditivas ascendentes y descendentes de formas que aún no están bien descritas y que justifican una mayor investigación.

Por último, las mejoras en las funciones cognitivas superiores, como la atención auditiva focalizada y la memoria de trabajo, también pueden dar forma a las habilidades auditivas en los músicos y beneficiar la comprensión del habla en el ruido (Kraus et al., 2012; Anderson et al., 2013). Además, se han descrito déficits tanto en la memoria de trabajo auditiva como en la atención en poblaciones con pérdida auditiva, así como en usuarios de implantes cocleares (Pisoni y Geers, 2000; Torppa et al., 2014). La medición del impacto funcional de la codificación acústica de alta fidelidad requiere gravar suficientemente el sistema auditivo mediante la reducción de la relación señal/ruido o, en el caso de los usuarios de implantes cocleares, la reducción de la muestra de sonido en la estimulación coclear gruesa. La creación de representaciones neuronales más ruidosas, ya sea acústica o eléctricamente, puede requerir representaciones más fieles del tronco cerebral para que el reconocimiento cortical de patrones pueda analizar y categorizar con éxito el significado semántico. Otros trabajos que investiguen el impacto del entrenamiento musical en la mejora de los umbrales para entornos auditivos ecológicos como las pruebas de audición en ruido (como en Parbery-Clark et al., 2009) pueden revelar beneficios funcionales medibles para complementar los hallazgos de los tiempos de reacción acelerados registrados en el presente estudio.

En resumen, Bidelman y Alain (2015) describen una asociación convincente entre el entrenamiento musical de toda la vida y la codificación categórica temporalmente precisa del habla, a pesar del riesgo de déficits del habla relacionados con la edad. Más trabajos en esta área pueden definir mejor el impacto del entrenamiento musical en las últimas etapas de la vida para los individuos que envejecen y las poblaciones clínicas como los usuarios de implantes cocleares que podrían beneficiarse enormemente de los efectos de la musicalidad.

Notas de pie de página

Nota del editor: Estas breves reseñas críticas de artículos recientes de la Revista, escritas exclusivamente por estudiantes de posgrado o becarios posdoctorales, tienen como objetivo resumir los hallazgos importantes del artículo y proporcionar una visión y un comentario adicionales. Para más información sobre el formato y la finalidad del Journal Club, consulte http://www.jneurosci.org/misc/ifa_features.shtml.

Este trabajo ha contado con el apoyo de una beca de formación de “Fundamentals in Neuroscience” (T32 MH064913). Agradezco a Mark Wallace, Reyna Gordon, Mike Butera y Anita Disney por sus útiles comentarios y edición.